¿Cuál es la forma canónica de verificar errores usando la API de tiempo de ejecución CUDA?

Al revisar las respuestas y los comentarios sobre las preguntas de CUDA, y en el wiki de etiquetas de CUDA , veo que a menudo se sugiere que el estado de devolución de cada llamada a la API debe verificarse en busca de errores. La documentación de la API contiene funciones como cudaGetLastError,...