¿Alguien sabe cómo resolver si los puntos 7, 16 y 29 son puntos influyentes o no? Leí en alguna parte que debido a que la distancia de Cook es inferior a 1, no lo son. Estoy bien?
r
regression
residuals
diagnostic
cooks-distance
Platypezid
fuente
fuente
Respuestas:
Algunos textos le dicen que los puntos para los cuales la distancia de Cook es mayor que 1 deben considerarse influyentes. Otros textos le dan un umbral de o , donde es el número de observaciones el número de variables explicativas. En su caso, la última fórmula debería producir un umbral de alrededor de 0.1.4 / ( N - k - 1 ) N k4 / N 4 / ( N- k - 1 ) norte k
John Fox (1), en su folleto sobre diagnósticos de regresión, es bastante cauteloso cuando se trata de dar umbrales numéricos. Él aconseja el uso de gráficos y examinar con más detalle los puntos con "valores de D que son sustancialmente más grandes que el resto". Según Fox, los umbrales solo deberían usarse para mejorar las pantallas gráficas.
En su caso, las observaciones 7 y 16 podrían considerarse influyentes. Bueno, al menos los miraría más de cerca. La observación 29 no es sustancialmente diferente de un par de otras observaciones.
(1) Fox, John. (1991) Diagnóstico de regresión: una introducción . Publicaciones sabias.
fuente
Hay otro punto que vale la pena mencionar aquí. En la investigación observacional, a menudo es difícil muestrear uniformemente en el espacio del predictor, y es posible que tenga solo algunos puntos en un área determinada. Dichos puntos pueden diferir del resto. Tener algunos casos distintos puede ser desconcertante, pero merece una reflexión considerable antes de ser relegado. Puede haber legítimamente una interacción entre los predictores, o el sistema puede cambiar para comportarse de manera diferente cuando los valores de los predictores se vuelven extremos. Además, pueden ayudarlo a desenredar los efectos de los predictores colineales. Los puntos influyentes pueden ser una bendición disfrazada.
fuente