¿Qué significa "todo lo demás igual" en la regresión múltiple?

22

Cuando hacemos regresiones múltiples y decimos que estamos viendo el cambio promedio en la variable para un cambio en una variable , manteniendo todas las demás variables constantes, ¿en qué valores mantenemos constantes las otras variables? Su media? ¿Cero? ¿Algún valor?yX

Me inclino a pensar que tiene cualquier valor; solo buscando aclaraciones. Si alguien tuviera una prueba, eso también sería genial.

EconStats
fuente
2
Encontré el ejemplo 10 en el artículo de Peter Kennedy muy útil para entender esto.
Dimitriy V. Masterov
Sí, el poco sobre aumentar el número de habitaciones mientras se mantienen constantes los pies cuadrados es un punto realmente observador. Ese documento es en realidad una mina de oro de ideas útiles, va en las notas de doctorado.
EconStats
1
Esta es realmente una pregunta muy interesante. Me pregunto si los economistas se preguntan qué significa exactamente "ceteris paribus".
mugen

Respuestas:

26

Tienes razón. Técnicamente, es cualquier valor . Sin embargo, cuando enseño esto, generalmente le digo a las personas que estás obteniendo el efecto de un cambio de una unidad en cuando todas las demás variables se mantienen en sus respectivos medios. Creo que esta es una forma común de explicarlo que no es específica para mí. Xj

Normalmente menciono que si no tiene interacciones, será el efecto de un cambio de una unidad en , sin importar cuáles sean los valores de sus otras variables. Pero me gusta comenzar con la formulación media. La razón es que hay dos efectos de incluir múltiples variables en un modelo de regresión. Primero, obtienes el efecto de controlando las otras variables (mira mi respuesta aquí ). La segunda es que la presencia de otras variables (típicamente) reduce la varianza residual del modelo, haciendo que sus variables (incluyendoX j X j X j XβjXjXjXj) 'más significativo'. Es difícil para la gente entender cómo funciona esto si las otras variables tienen valores que están por todas partes. Parece que aumentaría la variabilidad de alguna manera. Si piensa ajustar cada punto de datos hacia arriba o hacia abajo para el valor de cada variable hasta que el resto de las variables se hayan movido a sus respectivos medios, es más fácil ver que la variabilidad residual se ha reducido. X

No llego a las interacciones hasta una o dos clases después de haber introducido los conceptos básicos de la regresión múltiple. Sin embargo, cuando llego a ellos, vuelvo a este material. Lo anterior se aplica cuando no hay interacciones. Cuando hay interacciones, es más complicado. En ese caso, la variable que interactúa [s] se mantiene constante (muy específicamente) en , y en ningún otro valor. 0

Si quieres ver cómo se desarrolla esto algebraicamente, es bastante sencillo. Podemos comenzar con el caso de no interacción. Determinemos el cambio en cuando todas las demás variables se mantienen constantes en sus respectivas medias. Sin pérdida de generalidad, digamos que hay tres variables y estamos interesados ​​en comprender cómo el cambio en está asociado con un cambio de una unidad en , manteniendo y constantes en sus respectivos medios: X Y X3X1X2Y^XY^X3X1X2

Y^yo=β^0 0+β^1X¯1+β^2X¯2+β^3X3yoY^yo=β^0 0+β^1X¯1+β^2X¯2+β^3(X3yo+1) restando la primera ecuación de la segunda: Y^yo-Y^yo=β^0 0-β^0 0+β^1X¯1-β^1X¯1+β^2X¯2-β^2X¯2+β^3(X3yo+1)-β^3X3yoΔY=β^3X3yo+β^3-β^3X3yoΔY=β^3

Ahora es obvio que podríamos haber puesto cualquier valor para y en las dos primeras ecuaciones, siempre que pongamos el mismo valor para ( ) en ambas. Es decir, siempre que mantengamos y constantes . X 2 X 1 X 2 X 1 X 2X1X2X1X2X1X2

Por otro lado, no funciona de esta manera si tiene una interacción. Aquí muestro el caso donde hay un término de interacción : X1X3

Y^yo=β^0 0+β^1X¯1+β^2X¯2+β^3X3yo +β^4 4X¯1X3yoY^yo=β^0 0+β^1X¯1+β^2X¯2+β^3(X3yo+1)+β^4 4X¯1(X3yo+1) restando la primera ecuación de la segunda: Y^yo-Y^yo=β^0 0-β^0 0+β^1X¯1-β^1X¯1+β^2X¯2-β^2X¯2+β^3(X3yo+1)-β^3X3yo+ β^4 4X¯1(X3yo+1)-β^4 4X¯1X3yoΔY=β^3X3yo+β^3-β^3X3yo+β^4 4X¯1X3yo+β^4 4X¯1-β^4 4X¯1X3yoΔY=β^3+β^4 4X¯1

En este caso, no es posible mantener todo lo demás constante. Debido a que el término de interacción es una función de y , no es posible cambiar sin que el término de interacción cambie también. Por lo tanto, es igual al cambio en asociado con un cambio de una unidad en solo cuando la variable interactiva ( ) se mantiene en lugar de (o cualquier otro valor que no sea ), en cuyo caso el último término en la ecuación inferior se cae. X 3 X 3 β 3 Y X 3 X 1 0 ˉ X 1 0X1X3X3β^3Y^X3 X10 0X¯10 0

En esta discusión, me he centrado en las interacciones, pero en general, el problema es cuando hay una variable que es función de otra, de modo que no es posible cambiar el valor de la primera sin cambiar el valor respectivo de la otra variable . En tales casos, el significado de vuelve más complicado. Por ejemplo, si tenía un modelo con y , entonces es la derivada manteniendo todo lo demás igual y manteniendo (vea mi respuesta aquí ). También son posibles otras formulaciones aún más complicadas. XjX 2 j β jdYβ^jXjXj2β^j Xj=0reYreXjXj=0 0

gung - Restablece a Monica
fuente
1
Gracias, esta respuesta es genial en un par de niveles. En primer lugar, responde al punto principal en el que estaba interesado. En segundo lugar, pronosticó cuál sería mi pregunta de seguimiento, porque iba a preguntar cómo cambió esto con la introducción de términos de interacción. Gracias por las matemáticas también. Sé que esta pregunta es bastante básica, pero creo que nunca puedes ser demasiado explícito con estos conceptos.
EconStats
De nada, @EconStats. No hay ningún problema en incluir las matemáticas, a veces es mucho más fácil entender lo que está sucediendo.
gung - Restablece a Monica
Bueno, tengo que decir que cuando restaste la primera ecuación de la segunda ecuación, finalmente confirmó mis pensamientos originales de que no importa cuáles sean los valores de y , siempre que sean iguales en ambas ecuaciones. Me parece muy obvio, pero nunca antes había pensado en calcular el esa manera. Momento definitivo de bombilla para mí. X 3 βX2X3β
EconStats
También puede tomar la derivada de wrt y lo llevará al mismo lugar, pero esto es matemática más fácil (esencialmente álgebra de la escuela secundaria), por lo que será accesible para un público más amplio. X jYXj
gung - Restablece a Monica
1
@beetroot, si te entiendo correctamente, solo mantenlo en un nivel específico. (De lo contrario, podría pedir esto como una nueva pregunta.)
Gung - Restablecer Mónica
8

La matemática es simple, solo tome la diferencia entre 2 modelos con una de las variables x cambiadas por 1 y verá que no importa cuáles sean las otras variables (dado que no hay interacciones, polinomios u otros términos complicados).

Un ejemplo:

y[1]=si0 0+si1×X1+si2×X2

y[2]=si0 0+si1×(X1+1)+si2×X2

y[2]-y[1]=si0 0-si0 0+si1×X1-si1×X1+si1×1+si2×X2-si2×X2=si1

Greg Snow
fuente
6

Creo que te refieres a la dependencia en covariables ( ). Entonces, si el modelo es Y = β 0 + β 1 X 1 + β 2 X 2, el efecto de X i sobre Y siendo iguales todas las demás cosas sería Δ YXyo

Y=β0 0+β1X1+β2X2
XyoY para cualquierΔXicon todos los demásXjmantenidos constantes en cualquier valor.ΔYΔXyoΔXyoXj

Tenga en cuenta que es posible que y X 2 sean dependientes (por ejemplo, funciones entre sí) sin mostrar necesariamente una interacción significativa en el modelo lineal ( β 12 = 0 en Y = β 0 + β 1 X 1 + β 2 X 2 + β 12 X 1 X 2 ).X1X2β12=0 0Y=β0 0+β1X1+β2X2+β12X1X2

Justo como una tangente interesante aquí hay un ejemplo: Sea y X 2 = X 2 1 + N ( 0 , σ 2 2 ), entonces claramente cualquier cambio en X 1 afectará a X 2 . Sin embargo, la covarianza entre los dos es cero. c o v ( X 1 , X 2 ) = E ( X 1 XX1norte(0 0,σ12)X2=X12+norte(0 0,σ22)X1X2= E [ X 1 ( X 2 1 + a ) ] - E ( X 1 ) . E ( X 2 1 - a )

doov(X1,X2)=mi(X1X2)-mi(X1)mi(X2)
= E ( X 3 1 ) - E ( X 1 . una ) - 0. E ( X 2 1 - un ) = 0 - 0 - 0 = 0
=mi[X1(X12+una)]-mi(X1).mi(X12-una)wyothunanorte(0 0,σ22)
=mi(X13)-mi(X1.una)-0.mi(X12-una)=0 0-0 0-0 0=0 0

Entonces, en realidad, un cambio en estaría asociado con un cambio en X 2 y que Δ YX1X2ΔYΔXyoX1ΔYΔXyoXyoY

ΔYΔXyo

Hans Roggeman
fuente
Gracias Hans, en realidad estaba tratando de llegar al punto que hizo Gung, pero este es un buen ejemplo para cuando las dos variables son dependientes.
EconStats