Estadísticas y Big Data

15
2SLS pero Probit de segunda etapa

Estoy tratando de usar el análisis de variables instrumentales para inferir causalidad con datos observacionales. Me he encontrado con una regresión de mínimos cuadrados de dos etapas (2SLS) que probablemente aborde el problema de endogeneidad en mi investigación. Sin embargo, me gustaría que la...

15
Elegir K óptimo para KNN

Realicé un CV de 5 veces para seleccionar la K óptima para KNN. Y parece que cuanto más grande se hace K, más pequeño es el error ... Lo siento, no tenía una leyenda, pero los diferentes colores representan diferentes pruebas. Hay 5 en total y parece que hay poca variación entre ellos. El error...

15
Mostrar tres piezas de información en un gráfico

Nota: ahora se adjuntan 50 puntos de datos sin procesar. Quiero mostrar cuánto estudio he hecho, y cuántas páginas he completado durante la semana, divididas por día, y lo he hecho como se muestra a continuación: La gente me ha dicho que no pueden entender los gráficos, pero no tengo idea de...

15
¿Cuál es el problema con las pruebas post-hoc?

Mi profesor de estadística lo dice, todos los libros que miro lo afirman: las pruebas post-hoc no son científicas. Primero debe derivar una hipótesis de la teoría, y luego recopilar datos y analizarlos. Pero realmente no entiendo cuál es el problema. Supongamos que veo cifras de ventas para...