Tenía una pregunta sobre la interpretación de las gráficas generadas por plot (lm) en R. Me preguntaba si ustedes podrían decirme cómo interpretar las gráficas de ubicación de escala y apalancamiento residual. Cualquier comentario será bienvenido. Asumir conocimientos básicos de estadística, regresión y econometría.
r
regression
data-visualization
residuals
outliers
Huésped
fuente
fuente
Respuestas:
Como se indica en la documentación ,
plot.lm()
puede devolver 6 parcelas diferentes:Los gráficos [1] , [2] , [3] y [5] se devuelven por defecto. La interpretación [1] se discute en el CV aquí: interpretación de los residuos frente a la gráfica ajustada para verificar los supuestos de un modelo lineal . Le expliqué el supuesto de homocedasticidad y los gráficos que pueden ayudarlo a evaluarlo (incluidos los gráficos de ubicación de escala [2] ) en CV aquí: ¿Qué significa tener una varianza constante en un modelo de regresión lineal? He discutido qq-plots [3] en CV aquí: QQ plot no coincide con el histograma y aquí: PP- plot vs QQ-plot . También hay una muy buena descripción aquí: ¿Cómo interpretar un QQ-plot? Entonces, lo que queda es solo entender [5] , el gráfico de apalancamiento residual.
Para entender esto, necesitamos entender tres cosas:
Con estos hechos en mente, considere las tramas asociadas con cuatro situaciones diferentes:
21
A continuación se muestra el código que usé para generar estas parcelas:
* Para obtener ayuda para comprender cómo la regresión OLS busca encontrar la línea que minimiza las distancias verticales entre los datos y la línea, vea mi respuesta aquí: ¿Cuál es la diferencia entre la regresión lineal en y con x y x con y?
fuente