¿Cómo interpretar los efectos principales cuando el efecto de interacción no es significativo?

21

Ejecuté un modelo mixto lineal generalizado en R e incluí un efecto de interacción entre dos predictores. La interacción no fue significativa, pero los principales efectos (los dos predictores) sí lo fueron. Ahora, muchos ejemplos de libros de texto me dicen que si hay un efecto significativo de la interacción, los efectos principales no se pueden interpretar. Pero, ¿y si tu interacción no es significativa?

¿Puedo concluir que los dos predictores tienen un efecto en la respuesta? ¿O es mejor ejecutar un nuevo modelo donde dejo de lado la interacción? Prefiero no hacerlo, porque entonces tendría que controlar para múltiples pruebas.

rozemarijn
fuente
Sí, quise decir no significativo
rozemarijn
44
Si una de estas respuestas funciona para usted, tal vez podría aceptarla o solicitar una aclaración.
conjugateprior
Si la interacción no es significativa, entonces debe soltarla y ejecutar una regresión sin ella.
Aksakal

Respuestas:

21

Una pequeña queja

'Ahora muchos ejemplos de libros de texto me dicen que si hay un efecto significativo de la interacción, los efectos principales no pueden ser interpretados'

Espero que no sea cierto. Deberían decir que si hay un término de interacción, digamos entre X y Z llamado XZ, entonces la interpretación de los coeficientes individuales para X y para Z no puede interpretarse de la misma manera que si XZ no estuviera presente. Definitivamente puedes interpretarlo.

Pregunta 2

Si la interacción tiene sentido teórico, entonces no hay razón para no dejarla, a menos que las preocupaciones por la eficiencia estadística por alguna razón anulen las preocupaciones sobre la especificación errónea y permitan que su teoría y su modelo diverjan.

Dado que lo ha dejado, entonces interprete su modelo usando efectos marginales de la misma manera que si la interacción fuera significativa. Como referencia, incluyo un enlace a Brambor, Clark y Golder (2006) que explican cómo interpretar los modelos de interacción y cómo evitar las trampas comunes.

Piénselo de esta manera: a menudo tiene variables de control en un modelo que resultan no ser significativas, pero no las elimina (o no debería) cortarlas a la primera señal de estrellas faltantes.

Pregunta 1

¿Se pregunta si puede "concluir que los dos predictores tienen un efecto en la respuesta"? Aparentemente puedes, pero también puedes hacerlo mejor. Para el modelo con el término de interacción, puede informar qué efecto tienen realmente los dos predictores sobre la variable dependiente (efectos marginales) de manera indiferente a si la interacción es significativa o incluso está presente en el modelo.

La línea de fondo

Si elimina la interacción, volverá a especificar el modelo. Esto puede ser algo razonable por muchas razones, algunas teóricas y otras estadísticas, pero facilitar la interpretación de los coeficientes no es una de ellas.

conjugadoprior
fuente
2
Seguro. Y si está en R, entonces puede encontrar el paquete effectsmás fácil que trabajar en las matemáticas, y también para generalizar a modelos más complejos.
conjugateprior
1
En resumen, depende de lo que quieras decir con "más fácil".
John
¡Muchas gracias por la referencia de Brambor, Clark y Golder (2006)! Es una forma muy sensata de explicar los modelos de interacción. Muy útil para entender cómo interpretar (o NO) los coeficientes en tales modelos ... Por cierto, el documento viene con un apéndice de Internet: Modelos de interacción multiplicativa , que se presenta como una visión general muy útil de la discusión.
landroni
11

Si desea el efecto principal incondicional, sí, desea ejecutar un nuevo modelo sin el término de interacción porque ese término de interacción no le permite ver sus efectos principales incondicionales correctamente. Los efectos principales calculados con la interacción presente son diferentes de los efectos principales, ya que uno típicamente los interpreta en algo como ANOVA. Por ejemplo, es posible tener una interacción trivial y no significativa, los efectos principales no serán evidentes cuando la interacción esté en el modelo.

Digamos que tiene dos predictores, A y B. Cuando incluye el término de interacción, entonces se permite que la magnitud de A varíe dependiendo de B y viceversa. El coeficiente beta reportado en la salida de regresión para A es entonces uno de los muchos valores posibles. El valor predeterminado es usar el coeficiente de A para el caso en que B es 0 y el término de interacción es 0. Pero, cuando la regresión es simplemente aditiva, no se permite que A varíe entre B y se obtiene el efecto principal de A independientemente de B. Estos pueden ser valores muy diferentes incluso si la interacción es trivial porque significan cosas diferentes. El modelo aditivo es la única forma de evaluar realmente el efecto principal por sí mismo. Por otro lado, cuando su interacción es significativa (en teoría, no estadísticamente) y desea mantenerlo en su modelo, entonces la única forma de evaluar A es mirarlo a través de los niveles de B. Ese es realmente el tipo de cosas que debe considerar con respecto a la interacción, no si A es significativo. Solo puede ver realmente si hay un efecto incondicional de A en el modelo aditivo.

Por lo tanto, los modelos buscan cosas muy diferentes y esto no es un problema de pruebas múltiples. Usted debe mirar a las dos cosas. No decides en función de la importancia. El mejor efecto principal para informar es del modelo aditivo. Usted toma la decisión de incluir o presentar la interacción no significativa en función de cuestiones teóricas o problemas de presentación de datos, etc.

(Esto no quiere decir que no haya posibles problemas de pruebas múltiples aquí. Pero lo que significan depende en gran medida de la teoría que impulsa las pruebas).

John
fuente
Creo que la preocupación de @ rozemarijn es más sobre 'viajes de pesca', es decir, ejecutar muchos modelos que difieren en función de cómo resultaron las últimas estrellas, en lugar de múltiples pruebas en el sentido técnico
conjugateprior
1
Puede ejecutar todos los modelos que desee. Simplemente calcular un modelo no es una prueba. Una prueba es un procedimiento lógico, no matemático. El hecho de que gran parte del software por defecto devuelva valores p para las estimaciones de parámetros como si hubiera realizado algún tipo de prueba no significa que haya sido uno.
John
Y para agregar a lo que se dijo anteriormente, a menudo se pueden hacer pruebas implícitamente conscientes de que fallarán o pasarán. Esas pruebas cuentan para espeleología de datos tanto como las calculadas.
John
7

Si los efectos principales son significativos pero no la interacción, simplemente interprete los efectos principales, como sugirió.

No es necesario ejecutar otro modelo sin la interacción (generalmente no es el mejor consejo para excluir parámetros basados ​​en la importancia, hay muchas respuestas aquí discutiendo eso). Simplemente tome los resultados como están.

Henrik
fuente
1
¿Daría el mismo consejo en el segundo párrafo si el OP indicara que no se esperaba que la interacción ocurriera teóricamente, sino que se incluyó en el modelo como una prueba de bondad de ajuste?
whuber
Muchas gracias a todos por estas rápidas reacciones. Sin embargo, parece haber algunas diferencias de opinión ... John argumenta que tengo que ejecutar un nuevo modelo sin el efecto de interacción porque "El efecto principal calculado con la interacción presente es diferente de los verdaderos efectos principales".
rozemarijn
Sin embargo, Henrik argumenta que no debería ejecutar un nuevo modelo. Quizás pueda tomar una decisión si sé por qué el efecto principal calculado con el término de interacción es diferente de los verdaderos efectos principales ...
rozemarijn
En reacción a whuber, se esperaba que la interacción ocurriera teóricamente y no se incluyó como una prueba de bondad de ajuste.
rozemarijn
1
Para elaborar un poco: la distinción clave es entre la idea de los efectos de los parámetros . Los efectos son características del modelo en su conjunto, que pueden o no ser identificables como parámetros particulares. Cuando el modelo es lineal y no hay interacciones, pueden identificarse, pero cuando hay interacciones, no pueden. Mi afirmación es básicamente que si se ve obligado a elegir, como usted, debe preocuparse más por los efectos que por los parámetros. Y si haces eso, ya no te importa exactamente cuántos de estos últimos necesitas para generar los primeros.
conjugateprior