Términos de interacción y polinomios de orden superior

13

Si estuviera interesado en ajuste de dos vías interacciones entre una variable lineal explicativo y otra variable explicativa b que tiene una relación cuadrática con la variable dependiente y , tendría que incluir tanto la interacción con el componente cuadrática y la interacción con el lineal componente en el modelo? Por ejemplo: y a + b + b 2 + a b + a b 2 A su vez, a partir de mi hilo anterior: Términos de curvatura y selección de modelo , si este fuera un análisis de selección de modelo utilizandoaby

ya+b+b2+ab+ab2
MuMInen R, con muchas variables explicativas, los modelos de salida que contienen un término de interacción que incluye un término cuadrático solo serían válidos si el término de interacción con el componente lineal a : b también estaba presente en ese mismo modelo, así como un , b y b 2 como efectos directos?a:b2a:babb2
Sarah
fuente

Respuestas:

13

Sí, siempre debe incluir todos los términos, desde el orden más alto hasta el término lineal, en la interacción. Hay un par de hilos realmente geniales en CV que discuten temas relacionados que pueden resultarle útiles al pensar en esto:

La respuesta corta es que al no incluir ciertos términos en el modelo, obliga a que partes de él sean exactamente cero. Esto impone una inflexibilidad a su modelo que necesariamente causa sesgo, a menos que esos parámetros sean exactamente cero en realidad ; La situación es análoga a la supresión de la intercepción (que se puede ver aquí ).

También debe tener en cuenta que cualquier rutina de selección automática de modelo es peligrosa. (Para la historia básica, puede ser útil leer mi respuesta aquí .) Además de eso, sin embargo, estos algoritmos no 'piensan' en términos de las relaciones entre las variables, por lo que no necesariamente mantienen términos de nivel inferior en el modelo cuando se incluyen términos de potencia o interacción.

gung - Restablece a Monica
fuente