Esto es bastante difícil de describir para mí, pero intentaré que mi problema sea comprensible. Primero, debes saber que hasta ahora he hecho una regresión lineal muy simple. Antes de calcular el coeficiente, observé la distribución de mi . Es pesado dejado sesgado. Después de estimar el modelo, estaba bastante seguro de observar un residuo sesgado a la izquierda en un QQ-Plot también, pero absolutamente no lo hice. ¿Cuál podría ser la razón de esta solución? ¿Dónde está el error? O tiene la distribución nada que ver con la distribución del término de error?
regression
residuals
skewness
MarkDollar
fuente
fuente
Respuestas:
Para responder a su pregunta, tomemos un ejemplo muy simple. El modelo de regresión simple viene dado por , donde . Ahora suponga que es dicotómica. Si no es igual a cero, entonces la distribución de no será normal, sino una mezcla de dos distribuciones normales, una con media y otra con media .yyo= β0 0+ β1Xyo+ ϵyo ϵyo∼ N( 0 , σ2) Xyo β1 yyo β0 0 β0 0+β1
Si es lo suficientemente grande y es lo suficientemente pequeño, entonces un histograma de se verá bimodal. Sin embargo, también se puede obtener un histograma de que parece una distribución asimétrica "única". Aquí hay un ejemplo (usando R):β1 σ2 yyo yyo
Lo que importa no es la distribución de , sino la distribución de los términos de error.yyo
Y eso se ve perfectamente normal, no solo en sentido figurado =)
fuente
Con referencia a la excelente respuesta de @Wolfgang, aquí están las tramas de su código R:
fuente