Tengo problemas para interpretar los gráficos de interacción cuando hay una interacción entre las dos variables independientes.
Los siguientes gráficos son de este sitio:
Aquí, y son las variables independientes y es la variable dependiente.B D V
Pregunta: Hay interacción y efecto principal de , pero no hay efecto principal deB
Puedo ver que cuanto mayor sea el valor de , mayor es el valor de , siempre y B es al lo contrario, es constante, independientemente del valor de . Por lo tanto, existe una interacción entre y y el efecto principal de (dado que mayor conduce a mayor , manteniendo constante en ).D V B 1 D V A A B A A D V B B 1
Además, puedo ver que diferentes niveles de conducirán a diferentes niveles de , manteniendo constantesPor lo tanto, hay un efecto principal de B. Pero aparentemente este no es el caso. Entonces, esto debe significar que estoy interpretando erróneamente la trama de interacción. ¿Qué estoy haciendo mal?D V A
También estoy interpretando erróneamente la trama 6-8. La lógica que solía interpretarlos es la misma que usé anteriormente, por lo que si conozco el error que estoy cometiendo anteriormente, debería poder interpretar correctamente el resto. De lo contrario, actualizaré esta pregunta.
Respuestas:
Está interpretando los puntos individuales en el gráfico y llama a eso interacción, pero no lo es. Tomando el ejemplo que proporcionó, imagine cómo sería su descripción de la interacción si el efecto principal de A fuera mucho mayor. O tal vez si fuera mucho más pequeño, o incluso 0. Su descripción cambiaría, pero ese efecto principal debería ser independiente de la interacción. Por lo tanto, su descripción es de los datos pero no de la interacción per se.
Necesita restar los efectos principales para ver solo la interacción. Una vez que haga eso, TODAS las interacciones 2x2 se verán como la última en la página a la que hace referencia, una "X" simétrica. Por ejemplo, en el documento vinculado hay un conjunto de datos
Hay claramente efectos principales en las filas y columnas. Si se eliminan, puede ver la interacción (piense en las matrices siguientes que se operan simultáneamente).
(Las matrices restadas arriba se pueden calcular como las desviaciones de la gran media esperada en función de las medias marginales. La primera matriz es la gran media, 10.5. La segunda se basa en la desviación de las medias de la fila de la gran media. La primera fila es 5.5 mayor que la gran media, etc.)
Una vez que se eliminan los efectos principales, la interacción puede describirse en puntajes de efecto de la gran media o los puntajes de diferencia inversa. Un ejemplo de esto último para el ejemplo anterior sería: "la interacción es que el efecto de B en A1 es 7 y el efecto de B en A2 es -7". Esta afirmación sigue siendo cierta independientemente de las magnitudes de los efectos principales. También destaca que la interacción se trata de las diferencias en los efectos en lugar de los efectos en sí mismos.
Ahora considere los diversos gráficos en su enlace. En el fondo, la interacción tiene la misma forma que la descrita anteriormente y en el gráfico 8, una X simétrica. En ese caso, el efecto de B es en una dirección en A1 y en la otra dirección en A2 (tenga en cuenta que su uso de aumentar A en su la descripción sugiere que sabes que A no es categórico). Todo lo que sucede cuando se agregan los efectos principales es que esos cambian alrededor de los valores finales. Si solo está describiendo la interacción, entonces el de 8 es bueno para todos aquellos en los que la interacción está presente. Sin embargo, si su plan es describir los datos, la mejor manera es describir los efectos y la diferencia en los efectos. Por ejemplo, para el gráfico 7 podría ser: "Ambos efectos principales aumentan del nivel 1 al 2,
Esa es una descripción precisa y concisa de los datos, datos donde hay una interacción presente, que no contiene una descripción real de la interacción per se. Es una descripción de cómo los efectos principales son modificados por la interacción. Lo cual debería ser suficiente cuando no se suministran números.
fuente
Cuando existe un efecto de interacción entre dos factores, ya no tiene sentido hablar de los efectos principales. No hay un efecto principal, por el tipo de consideraciones que mencionas en tu publicación. Tienes el punto: solo conoces el efecto de un nivel de B si también conoces el nivel de A, por lo que no hay efectos principales.
En el gráfico anterior, si hubiera efectos principales, pero no interacción, sus dos líneas serían paralelas.
fuente
Si su modelo predice una respuesta de los predictores y , la respuesta esperada viene dada porY x1 x2
Si los coeficientes y son lo que usted llama "efectos principales", tenga en cuenta que, por ejemplo, da el cambio en cuando cambia en uno (unidad de lo que se mide) y cuando . No siempre es el caso que esta cantidad sea de particular interés: si es temperatura, el significado de cero dependerá de la elección arbitraria de medirlo en grados Celsius o Fahrenheit, si es sexo, entonces el significado de cero dependerá de la elección arbitraria de utilizar masculino o femenino como categoría de referencia; y por lo tanto el "efecto principal" deβ 2 β 1 E Y x 1 x 2 = 0 x 2 x 1 A 1 B 1 A 2 B 2 β 0 A B β 1 A 2 Bβ1 β2 β1 EY x1 x2=0 x2 x1 depende de una elección arbitraria. A veces, las personas codifican o traducen predictores solo para que estos parámetros tengan interpretaciones bastante razonables, lo cual es bastante justo, pero esto no hace una diferencia sustancial para el modelo, ni para sus predicciones o probabilidades. @ Ejemplo corresponde de John para el uso de -1 a código y , y 1 a código y : entonces es la gran media sobre todas las cuatro combinaciones de y , la diferencia entre la respuesta media para sobre ambos niveles de y la gran media, y así sucesivamente.A1 B1 A2 B2 β0 A B β1 A2 B
Sospecho que en el gráfico que muestra que se espera que asuma, o en otro lugar se les ha dicho, de que un valor cero para se encuentra a medio camino entre y ; en ese punto preciso, solo pasar de a no hace ninguna diferencia en la respuesta.A 1 A 2 B 1 B 2A A1 A2 B1 B2
fuente
En aras de la simplicidad intuitiva, pretenda que esto no es un problema estadístico, sino solo un problema matemático. Decir que los "datos" incluye cada punto exactamente en esas líneas en su ejemplo, por lo que la tarea es describir esas líneas en su totalidad como funciones de A y B . Podría decirse que este es el caso, y no es necesario fingir, porque su ejemplo no proporciona información sobre errores estándar o residuos. Luego, suponiendo que B 1 divide a B 2 perfectamente, y que ( B 1 , A 2 ) está exactamente tan arriba ( B 2 , A 2 ) como ( B 1 ,A 1 ) está debajo ( B 2 , A 1 ) e ignora los guiones (es decir, los rellena, básicamente) ...
La mitad de los puntos en B 1 están por encima de B 2 , y la mitad están por debajo, y sus diferencias se cancelan efectivamente. Esto significa que DV ( B 1 ) = DV ( B 2 ) cuando promediado a través de todos los valores de A . Sí, si se mantiene una constante en A 1 o A 2 , B 1 y B 2 serán diferentes, pero ya que las diferencias son iguales y opuestas a los valores opuestos de A , no hay ningún efecto principal de B . Diferencias en DV( B ) que dependen de los valores de A se describen completamente por el efecto de interacción. Se puede aplicar una lógica similar a las parcelas 6–8 para llegar a las conclusiones previstas.
fuente