Estadísticas y Big Data

9
Regularización: ¿por qué multiplicar por 1 / 2m?

En las notas de la semana 3 de la clase Coursera Machine Learning de Andrew Ng , se agrega un término a la función de costos para implementar la regularización: J+(θ)=J(θ)+λ2m∑j=1nθ2jJ+(θ)=J(θ)+λ2m∑j=1nθj2J^+(\theta) = J(\theta) + \frac{\lambda}{2m} \sum_{j=1}^n \theta_j^2 Las notas de la...

9
Aprendizaje de refuerzo en datos históricos

He estado trabajando para aprender la política óptima de comunicaciones para los clientes (qué notificaciones enviar, cuántas enviar y cuándo enviar). Tengo datos históricos de notificaciones pasadas enviadas (con marcas de tiempo) y sus actuaciones. Intentaba aplicar RL a este problema para...

9
GAM adaptativo suaviza en mgcv

El libro de Simon Wood sobre GAM y su mgcv de paquete R asociado son muy detallados e informativos cuando se trata de la teoría GAM y el ajuste del modelo a datos reales y simulados. Para los suavizados 1D, realmente no hay mucho de qué preocuparse, excepto para decidir si implementar funciones...

9
¿Por qué está sesgado el intervalo bayesiano creíble en esta regresión polinómica mientras que el intervalo de confianza es correcto?

Considere la siguiente gráfica en la que simulé datos de la siguiente manera. Observamos un resultado binario para el cual la probabilidad real de ser 1 se indica mediante la línea negra. La relación funcional entre una covariable y es un polinomio de tercer orden con enlace logístico (por lo que...

9
Datos correlacionados de alta dimensión y características principales / covariables descubiertas; prueba de hipótesis múltiples?

Tengo un conjunto de datos con aproximadamente 5,000 características / covariables a menudo correlacionadas y una respuesta binaria. Me dieron los datos, no los recolecté. Utilizo Lasso y el refuerzo de gradiente para construir modelos. Utilizo validación cruzada anidada iterada. Reporto los 40...