Estadísticas y Big Data

42
¿Por qué disminuir la muestra?

Supongamos que quiero aprender un clasificador que predice si un correo electrónico es spam. Y supongamos que solo el 1% de los correos electrónicos son spam. Lo más fácil sería aprender el clasificador trivial que dice que ninguno de los correos electrónicos son spam. Este clasificador nos daría...

42
¿Qué es maxout en la red neuronal?

¿Alguien puede explicar qué hacen las unidades maxout en una red neuronal? ¿Cómo funcionan y en qué se diferencian de las unidades convencionales? Traté de leer el artículo de 2013 "Maxout Network" de Goodfellow et al. (del grupo del profesor Yoshua Bengio), pero no lo entiendo del...

41
¿En qué se diferencian los puntajes de propensión de agregar covariables en una regresión, y cuándo se prefieren a la última?

Admito que soy relativamente nuevo en los puntajes de propensión y el análisis causal. Una cosa que no es obvia para mí como recién llegado es cómo el "equilibrio" usando puntajes de propensión es matemáticamente diferente de lo que sucede cuando agregamos covariables en una regresión. ¿Qué tiene...

41
Regresión logística en R (Odds Ratio)

Estoy tratando de realizar un análisis de regresión logística en R. He asistido a cursos que cubren este material usando STATA. Me resulta muy difícil replicar la funcionalidad en R. ¿Es maduro en esta área? Parece que hay poca documentación u orientación disponible. Producir resultados de odds...

41
OpenBugs vs. JAGS

Estoy a punto de probar un entorno de estilo BUGS para estimar modelos bayesianos. ¿Hay alguna ventaja importante a considerar al elegir entre OpenBugs o JAGS? ¿Es probable que uno reemplace al otro en el futuro previsible? Usaré el Gibbs Sampler elegido con R. Todavía no tengo una aplicación...

41
¿Cómo interpretar los valores de la medida F?

Me gustaría saber cómo interpretar una diferencia de valores de medida f. Sé que la medida f es una media equilibrada entre precisión y recuperación, pero estoy preguntando sobre el significado práctico de una diferencia en las medidas F. Por ejemplo, si un clasificador C1 tiene una precisión de...