Supongamos que estoy interesado en un modelo de regresión lineal, para , porque me gustaría ver si una interacción entre las dos covariables tiene un efecto en Y.
En las notas de un curso para profesores (con quienes no tengo contacto), dice: Al incluir términos de interacción, debe incluir sus términos de segundo grado. es decir, deben incluirse en la regresión.
¿Por qué debería uno incluir términos de segundo grado cuando solo estamos interesados en las interacciones?
Respuestas:
Depende del objetivo de la inferencia. Si desea hacer una inferencia de si existe una interacción, por ejemplo, en un contexto causal (o, más generalmente, si desea interpretar el coeficiente de interacción), esta recomendación de su profesor tiene sentido, y proviene del hecho de que la especificación errónea de la forma funcional puede conducir a inferencias erróneas sobre la interacción .
Aquí hay un ejemplo simple donde no hay un término de interacción entre y en la ecuación estructural de , sin embargo, si no incluye el término cuadrático de , concluiría erróneamente que interactúa con cuando de hecho no lo hace. t.x1 x2 y x1 x1 x2
Esto puede interpretarse simplemente como un caso de sesgo de variable omitido, y aquí es la variable omitida. Si regresa e incluye el término al cuadrado en su regresión, la interacción aparente desaparece.x21
Por supuesto, este razonamiento se aplica no solo a los términos cuadráticos, sino a la especificación errónea de la forma funcional en general. El objetivo aquí es modelar la función de expectativa condicional de manera apropiada para evaluar la interacción. Si se limita a modelar con regresión lineal, deberá incluir estos términos no lineales manualmente. Pero una alternativa es utilizar modelos de regresión más flexibles, como la regresión de cresta del núcleo, por ejemplo.
fuente
rm(list=ls())
en el código publicado aquí! Si las personas simplemente copian y pegan y ejecutan el código, podrían recibir una sorpresa ... Lo eliminé por ahora.Los dos modelos que enumeró en su respuesta se pueden volver a expresar para dejar en claro cómo se postula el efecto de para depender de (o al revés) en cada modelo.X1 X2
El primer modelo se puede volver a expresar así:
lo que muestra que, en este modelo, se supone que tiene un efecto lineal sobre (controlando el efecto de ) pero la magnitud de este efecto lineal, capturado por el coeficiente de pendiente de , cambia linealmente en función de . Por ejemplo, el efecto de en puede aumentar en magnitud a medida que aumentan los valores de .X1 Y X2 X1 X2 X1 Y X2
El segundo modelo puede reexpresarse así:
lo que muestra que, en este modelo, se supone que el efecto de en (que controla el efecto de ) es cuadrático en lugar de lineal. Este efecto cuadrático se captura al incluir y en el modelo. Si bien se supone que el coeficiente de es independiente de , se supone que el coeficiente de depende linealmente de .X1 Y X2 X1 X21 X21 X2 X1 X2
El uso de cualquiera de los modelos implicaría que está haciendo suposiciones completamente diferentes sobre la naturaleza del efecto de en (controlando el efecto de ).X1 Y X2
Por lo general, las personas se ajustan al primer modelo. Luego podrían trazar los residuos de ese modelo contra y por turnos. Si los residuos revelan un patrón cuadrático en los residuos en función de y / o , el modelo se puede aumentar en consecuencia para que incluya y / o (y posiblemente su interacción).X1 X2 X1 X2 X21 X22
Tenga en cuenta que simplifiqué la notación que usó para la coherencia y también expliqué el término de error explícito en ambos modelos.
fuente