Me gustaría saber, o tener referencias sobre el proceso de análisis por el que pasan la mayoría de los analistas de datos estadísticos para cada proyecto de análisis de datos.
Si hago una "lista", para completar el proyecto de análisis de datos, un analista debe:
- primero recoger los requisitos para el proyecto,
- planificar / diseñar su análisis de datos en función de esos requisitos antes
- en realidad preprocesando datos,
- ejecutando el análisis de datos y
- escribiendo un informe basado en los resultados de su análisis.
Para esta pregunta, estoy interesado en más detalles del Paso 2. Pero entiendo que esto no es prácticamente claro, ya que el analista podría tener que cambiar su plan o diseño de acuerdo con el resultado del análisis de datos. ¿Hay alguna referencia sobre este tema?
fuente
Encontré que El flujo de trabajo del análisis de datos con Stata es un buen libro, particularmente (pero no solo) como usuario de Stata. Encontré mucho con lo que no estoy de acuerdo, pero incluso eso ayudó a aclarar por qué hago las cosas de cierta manera.
fuente
CRISP-DM , acuñado por la compañía SPSS (ahora pertenece a IBM) es un acrónimo para el proceso de minería de datos, que es lo mismo que para el "análisis de datos". SAS tiene un proceso similar llamado SEMMA .
fuente