¡Los gráficos a continuación son gráficos de dispersión residual de una prueba de regresión para la cual ya se han cumplido los supuestos de "normalidad", "homocedasticidad" e "independencia"! Para probar el supuesto de "linealidad" , aunque, al observar los gráficos, se puede adivinar que la relación es curvilínea, pero la pregunta es: ¿cómo se puede usar el valor de "R2 lineal" para probar el supuesto de linealidad? ¿Cuál es el rango aceptable para el valor de "R2 lineal" para decidir si la relación es lineal? ¿Qué hacer cuando no se cumple el supuesto de linealidad y la transformación de los IV tampoco ayuda?
Aquí está el enlace a los resultados completos de la prueba.
Gráfico de dispersión:
Respuestas:
Tenga en cuenta que el supuesto de linealidad del que está hablando solo dice que la media condicional de dado X i es una función linealYi Xi . No puede usar el valor de para probar esta suposición.R2
Esto se debe a que es simplemente la correlación al cuadrado entre los valores observados y pronosticados, y el valor del coeficiente de correlación no determina de forma exclusiva la relación entre X e Y (lineal o de otro tipo) y son posibles los dos escenarios siguientes:R2 X Y
alto pero el supuesto de linealidad sigue siendo incorrecto de manera importanteR2
bajo pero la suposición de linealidad aún se cumpleR2
Discutiré cada uno a su vez:
(1) alto, pero el supuesto de linealidad sigue siendo erróneo de una manera importante:R2 el truco aquí es manipular el hecho de que la correlación es muy sensible a los valores atípicos . Suponga que tiene predictores que se generan a partir de una distribución de la mezcla que es normal el 99 % del tiempo y una masa puntual en M el otro 1 % y una variable de respuesta que esX1,...,Xn 99% M 1%
Re: ¿Qué hacer cuando no se cumple el supuesto de linealidad y la transformación de los IV tampoco ayuda?
Cuando la no linealidad es un problema, puede ser útil observar las gráficas de los residuos frente a cada predictor; si hay algún patrón notable, esto puede indicar la no linealidad en ese predictor. Por ejemplo, si este gráfico revela una relación "en forma de cuenco" entre los residuos y el predictor, esto puede indicar un término cuadrático faltante en ese predictor. Otros patrones pueden indicar una forma funcional diferente. En algunos casos, puede ser que no haya intentado corregir la transformación o que el modelo verdadero no sea lineal en ninguna versión transformada de las variables (aunque puede ser posible encontrar una aproximación razonable).
fuente
fuente