Comienzo con mi regresión OLS: donde D es una variable ficticia, las estimaciones se vuelven diferentes de cero con un valor p bajo. Luego realizo una prueba Ramsey RESET y descubro que tengo alguna especificación incorrecta de la ecuación, por lo tanto, incluyo x al cuadrado: y = β 0 + β 1 x 1 + β 2 x 2 1 + β 3 D + ε
- ¿Qué explica el término al cuadrado? (¿Aumento no lineal en Y?)
- Al hacer esto, mi estimación D ya no varía de cero, con un valor p alto. ¿Cómo interpreto el término cuadrado en mi ecuación (en general)?
Editar: Mejorando la pregunta.
Respuestas:
Bueno, primero, la variable ficticia se interpreta como un cambio en la intercepción. Es decir, su coeficiente le da la diferencia en la intersección cuando D = 1 , es decir, cuando D = 1 , la intersección es β 0 + β 3 . Esa interpretación no cambia al agregar el cuadrado x 1 .β3 D=1 D=1 β0+β3 x1
Ahora, el punto de agregar un cuadrado a la serie es que asumes que la relación desaparece en cierto punto. Mirando tu segunda ecuación
Tomando el derivado wrtx1
Ese es el punto en el que la relación tiene su punto de inflexión. Puede echar un vistazo a la salida de Wolfram-Alpha para la función anterior, para visualizar su problema.
fuente
Un buen ejemplo de incluir el cuadrado de la variable proviene de la economía laboral. Si asume
y
como salario (o logaritmo de salario) yx
como edad, entonces incluirx^2
significa que está probando la relación cuadrática entre una edad y el salario. El salario aumenta con la edad a medida que las personas adquieren más experiencia, pero a mayor edad, el salario comienza a aumentar a un ritmo decreciente (las personas envejecen y no estarán tan saludables para trabajar como antes) y en algún momento el salario no aumenta ( alcanza el nivel salarial óptimo) y luego comienza a caer (se jubilan y sus ganancias comienzan a disminuir). Entonces, la relación entre salario y edad se invierte en forma de U (efecto del ciclo de vida). En general, para el ejemplo mencionado aquí,age
se espera que el coeficiente en sea positivo y que enage^2
es negativo. El punto aquí es que debe haber una base teórica / justificación empírica para incluir el cuadrado de la variable. La variable ficticia, aquí, puede considerarse como la representación del género del trabajador. También puede incluir el término de interacción de género y edad para examinar si el diferencial de género varía según la edad.fuente