Estadísticas y Big Data

13
Regresión lineal cuando solo conoces

Supongamos .Xβ=YXβ=YX\beta =Y No sabemos exactamente, sólo su correlación con cada predictor, .X t YYYYXtYXtYX^\mathrm{t}Y La solución de mínimos cuadrados ordinarios (OLS) es y no hay ningún problema.β=(XtX)−1XtYβ=(XtX)−1XtY\beta=(X^\mathrm{t} X)^{-1} X^\mathrm{t}Y Pero supongamos que es casi...

13
Predicciones usando glmnet en R

Estoy tratando de modelar algunos datos usando el glmnetpaquete en R. Digamos que tengo los siguientes datos training_x <- data.frame(variable1 = c(1, 2, 3, 2, 3), variable2 = c(1, 2, 3, 4, 5)) y <- c(1, 2, 3, 4, 5) (Esto es una simplificación; mis datos son mucho más complicados). Luego...

13
Ayúdame a comprender los valores

Estoy tratando de ejecutar un logit bayesiano en los datos aquí . Estoy usando bayesglm()el armpaquete en R. La codificación es bastante sencilla: df = read.csv("http://dl.dropbox.com/u/1791181/bayesglm.csv", header=T) library(arm) model = bayesglm(PASS ~ SEX + HIGH, family=binomial(link="logit"),...

13
Buscando una ilustración real de la cita de Fisher sobre DoE

Mi equipo y yo quisiéramos dar una presentación a los no estadísticos de la compañía sobre la utilidad del diseño de experimentos. Estos no estadísticos también son nuestros clientes y generalmente no nos consultan antes de recopilar sus datos. ¿Conoce algunos ejemplos reales que ilustrarían la...

13
¿Cómo puede manejar estimaciones

¿Estabilidad beta en regresión lineal con alta multicolinealidad? Digamos que en una regresión lineal, las variables y x 2 tienen una alta multicolinealidad (la correlación es de alrededor de 0.9).X1x1x_1X2x2x_2 Nos preocupa la estabilidad del coeficiente , por lo que debemos tratar la...