En regresión lineal, hacemos los siguientes supuestos
Una de las formas en que podemos resolver la regresión lineal es a través de ecuaciones normales, que podemos escribir como
Desde un punto de vista matemático, la ecuación anterior solo necesita que sea invertible. Entonces, ¿por qué necesitamos estos supuestos? Pregunté a algunos colegas y mencionaron que es para obtener buenos resultados y las ecuaciones normales son un algoritmo para lograrlo. Pero en ese caso, ¿cómo ayudan estos supuestos? ¿Cómo ayuda su defensa para obtener un mejor modelo?
regression
assumptions
Reloj esclavo
fuente
fuente
Respuestas:
Tienes razón: no es necesario que cumplas estos supuestos para ajustar una línea de mínimos cuadrados a los puntos. Necesita estos supuestos para interpretar los resultados. Por ejemplo, suponiendo que no haya una relación entre una entrada e , ¿cuál es la probabilidad de obtener un coeficiente al menos tan grande como lo que vimos en la regresión?X1 Y β1
fuente
Pruebe la imagen del cuarteto de Anscombe de Wikipedia para tener una idea de algunos de los posibles problemas con la interpretación de la regresión lineal cuando algunos de esos supuestos son claramente falsos: la mayoría de las estadísticas descriptivas básicas son las mismas en los cuatro (y los valores individuales son idénticos en todos, pero en la parte inferior derecha)xi
fuente
No necesita esos supuestos para adaptarse a un modelo lineal. Sin embargo, sus estimaciones de parámetros podrían estar sesgadas o no tener la varianza mínima. Violar los supuestos te hará más difícil interpretar los resultados de la regresión, por ejemplo, construir un intervalo de confianza.
fuente
Ok, las respuestas hasta ahora son así: si violamos los supuestos, entonces pueden suceder cosas malas. Creo que la dirección interesante es: cuando se cumplen todos los supuestos que necesitamos (en realidad un poco diferentes de los anteriores), ¿por qué y cómo podemos estar seguros de que la regresión lineal es el mejor modelo?
fuente
Los dos supuestos clave son
Ver La discusión en el libro de Julian Faraway .
Si esto es cierto, OLS es sorprendentemente resistente a las infracciones en los otros supuestos que ha enumerado.
fuente