Cuando hacemos regresiones múltiples y decimos que estamos viendo el cambio promedio en la variable para un cambio en una variable , manteniendo todas las demás variables constantes, ¿en qué valores mantenemos constantes las otras variables? Su media? ¿Cero? ¿Algún valor?
Me inclino a pensar que tiene cualquier valor; solo buscando aclaraciones. Si alguien tuviera una prueba, eso también sería genial.
Respuestas:
Tienes razón. Técnicamente, es cualquier valor . Sin embargo, cuando enseño esto, generalmente le digo a las personas que estás obteniendo el efecto de un cambio de una unidad en cuando todas las demás variables se mantienen en sus respectivos medios. Creo que esta es una forma común de explicarlo que no es específica para mí.Xj
Normalmente menciono que si no tiene interacciones, será el efecto de un cambio de una unidad en , sin importar cuáles sean los valores de sus otras variables. Pero me gusta comenzar con la formulación media. La razón es que hay dos efectos de incluir múltiples variables en un modelo de regresión. Primero, obtienes el efecto de controlando las otras variables (mira mi respuesta aquí ). La segunda es que la presencia de otras variables (típicamente) reduce la varianza residual del modelo, haciendo que sus variables (incluyendoX j X j X j Xβj Xj Xj Xj ) 'más significativo'. Es difícil para la gente entender cómo funciona esto si las otras variables tienen valores que están por todas partes. Parece que aumentaría la variabilidad de alguna manera. Si piensa ajustar cada punto de datos hacia arriba o hacia abajo para el valor de cada variable hasta que el resto de las variables se hayan movido a sus respectivos medios, es más fácil ver que la variabilidad residual se ha reducido. X
No llego a las interacciones hasta una o dos clases después de haber introducido los conceptos básicos de la regresión múltiple. Sin embargo, cuando llego a ellos, vuelvo a este material. Lo anterior se aplica cuando no hay interacciones. Cuando hay interacciones, es más complicado. En ese caso, la variable que interactúa [s] se mantiene constante (muy específicamente) en , y en ningún otro valor.0 0
Si quieres ver cómo se desarrolla esto algebraicamente, es bastante sencillo. Podemos comenzar con el caso de no interacción. Determinemos el cambio en cuando todas las demás variables se mantienen constantes en sus respectivas medias. Sin pérdida de generalidad, digamos que hay tres variables y estamos interesados en comprender cómo el cambio en está asociado con un cambio de una unidad en , manteniendo y constantes en sus respectivos medios: X Y X3X1X2Y^ X Y^ X3 X1 X2
Ahora es obvio que podríamos haber puesto cualquier valor para y en las dos primeras ecuaciones, siempre que pongamos el mismo valor para ( ) en ambas. Es decir, siempre que mantengamos y constantes . X 2 X 1 X 2 X 1 X 2X1 X2 X1 X2 X1 X2
Por otro lado, no funciona de esta manera si tiene una interacción. Aquí muestro el caso donde hay un término de interacción :X1X3
En este caso, no es posible mantener todo lo demás constante. Debido a que el término de interacción es una función de y , no es posible cambiar sin que el término de interacción cambie también. Por lo tanto, es igual al cambio en asociado con un cambio de una unidad en solo cuando la variable interactiva ( ) se mantiene en lugar de (o cualquier otro valor que no sea ), en cuyo caso el último término en la ecuación inferior se cae. X 3 X 3 β 3 Y X 3 X 1 0 ˉ X 1 0X1 X3 X3 β^3 Y^ X3 X1 0 0 X¯1 0 0
En esta discusión, me he centrado en las interacciones, pero en general, el problema es cuando hay una variable que es función de otra, de modo que no es posible cambiar el valor de la primera sin cambiar el valor respectivo de la otra variable . En tales casos, el significado de vuelve más complicado. Por ejemplo, si tenía un modelo con y , entonces es la derivada manteniendo todo lo demás igual y manteniendo (vea mi respuesta aquí ). También son posibles otras formulaciones aún más complicadas. XjX 2 j β jdYβ^j Xj X2j β^j Xj=0reYreXj Xj= 0
fuente
La matemática es simple, solo tome la diferencia entre 2 modelos con una de las variables x cambiadas por 1 y verá que no importa cuáles sean las otras variables (dado que no hay interacciones, polinomios u otros términos complicados).
Un ejemplo:
fuente
Creo que te refieres a la dependencia en covariables ( ). Entonces, si el modelo es Y = β 0 + β 1 X 1 + β 2 X 2, el efecto de X i sobre Y siendo iguales todas las demás cosas sería Δ YXyo
Tenga en cuenta que es posible que y X 2 sean dependientes (por ejemplo, funciones entre sí) sin mostrar necesariamente una interacción significativa en el modelo lineal ( β 12 = 0 en Y = β 0 + β 1 X 1 + β 2 X 2 + β 12 X 1 X 2 ).X1 X2 β12= 0 Y= β0 0+ β1X1+ β2X2+ β12X1X2
Justo como una tangente interesante aquí hay un ejemplo: Sea y X 2 = X 2 1 + N ( 0 , σ 2 2 ), entonces claramente cualquier cambio en X 1 afectará a X 2 . Sin embargo, la covarianza entre los dos es cero. c o v ( X 1 , X 2 ) = E ( X 1 XX1∼ N( 0 , σ21) X2= X21+ N( 0 , σ22) X1 X2 = E [ X 1 ( X 2 1 + a ) ] - E ( X 1 ) . E ( X 2 1 - a )
Entonces, en realidad, un cambio en estaría asociado con un cambio en X 2 y que Δ YX1 X2 Δ YΔ Xyo X1 Δ YΔ Xyo Xyo Y
fuente