Estadísticas y Big Data

16
Normalización previa a la validación cruzada

¿La normalización de datos (para tener una media de desviación estándar de unidad y cero) antes de realizar una validación cruzada repetida de k veces tiene alguna consecuencia negativa como el sobreajuste? Nota: esto es para una situación donde #cases> total #características Estoy...

16
¿Limpieza de datos de formato inconsistente en R?

A menudo trato con datos de encuestas desordenados que requieren mucha limpieza antes de que se puedan realizar estadísticas. Solía ​​hacer esto "manualmente" en Excel, a veces usando fórmulas de Excel, y otras comprobando las entradas una por una. Comencé a hacer cada vez más estas tareas...

16
Proceso gaussiano: propiedades de aproximación de funciones

Estoy aprendiendo sobre el Proceso Gaussiano y solo he escuchado fragmentos. Realmente agradecería comentarios y respuestas. Para cualquier conjunto de datos, ¿es cierto que una aproximación de la función del Proceso Gaussiano daría un error de ajuste cero o insignificante en los puntos de datos?...