Tengo una regresión lineal que es bastante buena, supongo (es para un proyecto universitario, así que realmente no tengo que ser súper precisa).
El punto es que si trazo los residuos frente a los valores pronosticados, hay (según mi maestro) un indicio de heterocedasticidad.
Pero si trazo el QQ-Plot de los residuos, está claro que normalmente están distribuidos. Además, la prueba de Shapiro en los residuos tiene un valor de , por lo que creo que no hay duda de que los residuos se distribuyen normalmente.0.8
Pregunta: ¿Cómo puede haber heterocedasticidad en los valores pronosticados si los residuos se distribuyen normalmente?
ncvTest
función del paquete del automóvil paraR
realizar una prueba formal de heterocedasticidad. En el ejemplo de whuber, el comandoncvTest(fit)
produce un valor que es casi cero y proporciona una fuerte evidencia contra la variación constante del error (que se esperaba, por supuesto).Respuestas:
Una forma de abordar esta pregunta es mirarla al revés: ¿cómo podríamos comenzar con los residuos distribuidos normalmente y organizarlos para que sean heterocedásticos? Desde este punto de vista, la respuesta se vuelve obvia: asocie los residuos más pequeños con los valores pronosticados más pequeños.
Para ilustrar, aquí hay una construcción explícita.
Los datos a la izquierda son claramente heteroscedastic en relación con el ajuste lineal (se muestra en rojo). Esto es conducido a casa por los residuos frente a la gráfica prevista a la derecha. Pero, por construcción, el conjunto desordenado de residuos está cerca de la distribución normal, como muestra su histograma en el medio. (El valor p en la prueba de normalidad de Shapiro-Wilk es 0.60, obtenido con el
R
comandoshapiro.test(residuals(fit))
emitido después de ejecutar el siguiente código).Los datos reales también pueden verse así. La moraleja es que la heterocedasticidad caracteriza una relación entre el tamaño residual y las predicciones, mientras que la normalidad no nos dice nada acerca de cómo los residuos se relacionan con otra cosa.
Aquí está el
R
código para esta construcción.fuente
En la regresión de mínimos cuadrados ponderados (WLS), son los factores aleatorios de los residuos estimados que es posible que desee ver que están distribuidos normalmente, aunque a menudo no es tan importante. Los residuos estimados se pueden factorizar, como se muestra en un caso de regresión simple (un regresor y a través del origen), en la parte inferior de la página 1 y las mitades inferiores de las páginas 2 y 7 en https://www.researchgate.net/publication / 263036348_Properties_of_Weighted_Least_Squares_Regression_for_Cutoff_Sampling_in_Establishment_Surveys De todos modos, esto podría ayudar a mostrar dónde puede aparecer la normalidad.
fuente