Estadísticas y Big Data

14
¿Cómo derivar la interpretación probabilística de las AUC?

¿Por qué el área bajo la curva ROC es la probabilidad de que un clasificador clasifique una instancia "positiva" elegida al azar (de las predicciones recuperadas) más alta que una instancia "positiva" elegida al azar (de la clase positiva original)? ¿Cómo se prueba matemáticamente esta afirmación...

14
Lazo bayesiano vs espiga y losa

Pregunta: ¿Cuáles son las ventajas / desventajas de usar uno antes que otro para la selección de variables? Supongamos que tengo la probabilidad: donde puedo poner cualquiera de las anteriores: w i ∼ π δ 0 + ( 1 - π ) N ( 0 , 100 )y∼N(Xw,σ2I)y∼N(Xw,σ2I)y\sim\mathcal{N}(Xw,\sigma^2I) o: w i ∼...

14
GAM vs LOESS vs splines

Contexto : Quiero trazar una línea en un diagrama de dispersión que no aparece paramétrico, por lo tanto, estoy usando geom_smooth()en ggploten R. Devuelve automáticamente. geom_smooth: method="auto" and size of largest group is >=1000, so using gam with formula: y ~ s(x, bs = "cs"). Use 'method...