Regresión moderada: ¿Por qué calculamos un término * producto * entre los predictores?

12

Los análisis de regresión moderada a menudo se usan en ciencias sociales para evaluar la interacción entre dos o más predictores / covariables.

Normalmente, con dos variables predictoras, se aplica el siguiente modelo:

Y=β0+β1X+β2M+β3XM+e

Observe que la prueba de moderación es operacionalizada por el término del producto XM (la multiplicación entre la variable independiente X y la variable moderadora M ). Mi pregunta fundamental es: ¿por qué calculamos realmente un término de producto entre X y M ? ¿Por qué no, por ejemplo, la diferencia absoluta |MX|o solo la suma X+M ?

Curiosamente, Kenny alude a este problema aquí http://davidakenny.net/cm/moderation.htm diciendo: "Como se verá, la prueba de moderación no siempre está operativa por el término del producto XM", pero no se da más explicación . Una ilustración o prueba formal sería esclarecedora, supongo / espero.

denominador
fuente

Respuestas:

12

Un "moderador" afecta los coeficientes de regresión de Y contra X : pueden cambiar a medida que cambian los valores del moderador. Por lo tanto, en general, el modelo de regresión simple de moderación es

E(Y)=α(M)+β(M)X

donde y son funciones del moderador en lugar de constantes no afectados por valores de .β M MαβMM

En el mismo espíritu en el que la regresión se basa en una aproximación lineal de la relación entre e , podemos esperar que tanto como sean, al menos aproximadamente, funciones lineales de todo el rango de valores de en los datos:Y α β M MXYαβMM

E(Y)=α0+α1M+O(M2)+(β0+β1M+O(M2))X=α0+β0X+α1M+β1MX+O(M2)+O(M2)X.

Descartar los términos no lineales ("big-O"), con la esperanza de que sean demasiado pequeños para importar, da el modelo de interacción multiplicativa (bilineal)

(1)E(Y)=α0+β0X+α1M+β1MX.

Esta derivación sugiere una interpretación interesante de los coeficientes: es la velocidad a la que cambia la intersección, mientras que es la velocidad a la que cambia la pendiente . ( y son la pendiente y la intersección cuando se establece (formalmente) en cero). es el coeficiente del "término del producto" . Responde la pregunta de esta manera: M β 1 M α 0 β 0 M β 1 M Xα1Mβ1Mα0β0Mβ1MX

Modelamos la moderación con un término producto cuando se espera que el moderador será (aproximadamente, en promedio) tienen una relación lineal con la pendiente de vs .M Y XMXMY X


De interés es que esta derivación señala el camino hacia una extensión natural del modelo, lo que podría sugerir formas de verificar la bondad del ajuste. Si no le preocupa la no linealidad en ya sea que sepa o asuma que el modelo es exacto, entonces querrá extender el modelo para acomodar los términos que se eliminaron:( 1 )X(1)

E(Y)=α0+β0X+α1M+β1MX+α2M2+β2M2X.

Probar la hipótesis evalúa la bondad del ajuste. Estimar y podría indicar de qué manera podría ser necesario extender el modelo : para incorporar la no linealidad en (cuando ) o una relación de moderación más complicada (cuando ) o posiblemente ambos. (Tenga en cuenta que esta prueba no sería sugerida por una expansión en serie de potencia de una función genérica .α 2 β 2 ( 1 ) M α 20 β 20 f ( X , M )α2=β2=0α2β2(1)Mα20β20f(X,M)


Finalmente, si descubriera que el coeficiente de interacción no era significativamente diferente de cero, pero que el ajuste no es lineal (como lo demuestra un valor significativo de ), concluiría que (a) existe moderación pero ( b) no está modelado por un término , sino por algunos términos de orden superior que comienzan con . Este podría ser el tipo de fenómeno al que se refería Kenny.β 2 M X M 2 Xβ1β2MXM2X

whuber
fuente
8

Si usa la suma de predictores para modelar su interacción, su ecuación sería:

Y=β0+β1X+β2M+β3(X+M)+e=β0+β1X+β2M+β3X+β3M+e=β0+(β1+β3)X+(β2+β3)M+e=β0+β1X+β2M+e

where y . Por lo tanto, su modelo no tendría interacción alguna. Claramente, este no es el caso con el producto.β1=β1+β3β2=β2+β3

Recordemos la definición del valor absoluto:

|XM|={XM,XMMX,X<M

Aunque puede reducir el modelo al que solo tiene términos y , usando def. de, el valor absoluto es una "forma especializada de moderación que es poco probable que sea realista en muchas situaciones", como se señala en el comentario a continuación.β0+β1X+β2M+β3|XM|+eXM|XM|

Milos
fuente
1
En realidad, incluyendo unEl término es demostrablemente una forma de moderación: el valor de cambia . Sin embargo, es una forma limitada y especializada de moderación que es poco probable que sea realista en muchas situaciones. No es correcto decir que ese modelo tiene "solo efectos principales". |XM|Mβ2
whuber
1
Sí, tienes razón,es una forma de moderación, me dejé llevar por la transformación y editaré la respuesta en consecuencia. Gracias por señalar esto. |XM|
Milos
@Milos: Su ejemplo sobre la suma de predictores fue revelador, algo vergonzoso, debo decir porque ya debería haberme dado cuenta de las implicaciones matemáticas;) whuber: Hasta donde lo entiendo, el valor absoluto solo es útil cuando ambas variables predictoras se miden en las mismas unidades (por ejemplo, dos pruebas psicométricas, utilizando la misma métrica, como las puntuaciones z o las puntuaciones T). La diferencia absoluta entre X y M es una métrica útil , aunque no es la única posible (es decir, el término prodcut también podría usarse).
denominador
6

No encontrará una prueba formal para usar el moderador multiplicativo. Puede apoyar este enfoque por otros medios. Por ejemplo, observe la expansión Taylor-MacLaurin de una función :f(X,M)

f(X,M)=f(0,0)+f(0,0)TT+f(0,0)MM+2f(0,0)TMTM+2f(0,0)2T2T2+2f(0,0)2M2M2

Si conecta una función de esta forma en la ecuación de Taylor, obtendrá esto:f(X,M)=β0+βXX+βMM+βXMXM

f(X,M)=β0+βXX+βMM+βXMXM

Entonces, la razón aquí es que esta forma multiplicativa particular de la moderación es básicamente una aproximación de Taylor de segundo orden de una relación de moderación genéricaf(X,M)

ACTUALIZACIÓN: si incluye términos cuadráticos, como @whuber sugirió, esto sucederá: conecte esto a Taylor:

g(X,M)=b0+bXX+bMM+bXMXM+bX2X2+bM2M2
g(X,M)=b0+bXX+bMM+bXMXM+bX2X2+bM2M2

Esto muestra que nuestro nuevo modelo con términos cuadráticos corresponde a una aproximación completa de Taylor de segundo orden, a diferencia del modelo de moderación original .f ( X , M )g(X,M)f(X,M)

Aksakal
fuente
Dado que la base de su argumento es la expansión de Taylor, ¿por qué no incluyó también los otros dos términos cuadráticos y ? Es cierto que no son formas de moderación, pero su inclusión en el modelo generalmente afectará a . M 2 β X MX2M2βXM
whuber
@whuber, decidí mantener la publicación corta, esa es la razón principal. De lo contrario, comencé a escribir sobre mi preferencia de incluir términos de segundo orden cada vez que tenga un término cruzado, luego lo eliminé.
Aksakal