Izquierda sesgada vs. distribución simétrica observada

10

Esto es bastante difícil de describir para mí, pero intentaré que mi problema sea comprensible. Primero, debes saber que hasta ahora he hecho una regresión lineal muy simple. Antes de calcular el coeficiente, observé la distribución de mi . Es pesado dejado sesgado. Después de estimar el modelo, estaba bastante seguro de observar un residuo sesgado a la izquierda en un QQ-Plot también, pero absolutamente no lo hice. ¿Cuál podría ser la razón de esta solución? ¿Dónde está el error? O tiene la distribución nada que ver con la distribución del término de error?yy

MarkDollar
fuente
@Aniko da una buena respuesta en respuesta a tu pregunta anterior.
Whuber

Respuestas:

22

Para responder a su pregunta, tomemos un ejemplo muy simple. El modelo de regresión simple viene dado por , donde . Ahora suponga que es dicotómica. Si no es igual a cero, entonces la distribución de no será normal, sino una mezcla de dos distribuciones normales, una con media y otra con media .yyo=β0 0+β1Xyo+ϵyoϵyonorte(0 0,σ2)Xyoβ1yyoβ0 0β0 0+β1

Si es lo suficientemente grande y es lo suficientemente pequeño, entonces un histograma de se verá bimodal. Sin embargo, también se puede obtener un histograma de que parece una distribución asimétrica "única". Aquí hay un ejemplo (usando R):β1σ2yyoyyo

xi <- rbinom(10000, 1, .2)
yi <- 0 + 3 * xi + rnorm(10000, .7)
hist(yi, breaks=20)
qqnorm(yi); qqline(yi)

Lo que importa no es la distribución de , sino la distribución de los términos de error.yyo

res <- lm(yi ~ xi)
hist(resid(res), breaks=20)
qqnorm(resid(res)); qqline(resid(res))

Y eso se ve perfectamente normal, no solo en sentido figurado =)

Wolfgang
fuente
"pero la distribución de los términos de error" ¿Quiere decir que los residuos no son términos de error, verdad? Más acerca de los residuos frente al error: stats.stackexchange.com/questions/133389/…
vasili111
7

Con referencia a la excelente respuesta de @Wolfgang, aquí están las tramas de su código R:

ingrese la descripción de la imagen aquí

Aplazamiento de pago
fuente