¿Cómo usar la prueba de Hausman para la discriminación de género?

8

Estoy tratando de estimar la brecha salarial de género para los trabajadores de oficina masculinos y femeninos en una gran empresa sueca para probar si existe discriminación de género. La prueba de Hausman rechaza la nulidad de que los efectos fijos individuales son aleatorios y, por lo tanto, no puedo confiar en OLS agrupados o efectos aleatorios. El problema es que no puedo mantener a mi maniquí femenino en una regresión de efectos fijos porque no varía con el tiempo.

Me sugirieron usar una prueba de Hausman en su lugar para probar la discriminación, pero realmente no puedo ver cómo se debe usar para encontrar una diferencia en los ingresos entre trabajadores y trabajadoras. Esperaba que tal vez alguien aquí entendiera un poco mejor este consejo. Si es así, ¿podría arrojarme algo de luz sobre esto?

kerst
fuente

Respuestas:

11

Veo el razonamiento detrás de este consejo, pero i) esta persona debería haberte explicado mejor y ii) también deberían haber mencionado los supuestos restrictivos que subyacen a esta idea.

En la prueba de Hausman, generalmente pregunta si hay una diferencia entre un modelo consistente pero ineficiente y un modelo potencial inconsistente que es más eficiente. En el caso estándar en el que se comparan los efectos fijos y aleatorios, el estimador de efectos fijos es consistente independientemente de que los efectos individuales estén o no correlacionados con las otras variables explicativas, pero es menos eficiente que el estimador de efectos aleatorios, que solo es consistente para efectos fijos no correlacionados con variables explicativas.

Cualquiera de los dos grupos (masculino o femenino) tendrá menos observaciones. A priori, supongo que este es el grupo femenino. Entonces, si ejecuta la misma especificación de regresión donde es ganancias, son las mismas variables explicativas de variante de tiempo, son las efectos fijos individuales y es un error estocástico, entonces una diferencia entre los modelos masculino y femenino implicaría que existe un tratamiento diferente de hombres y mujeres en términos de salarios. Las estadísticas de la prueba en este caso serían

yit=α+Xitβ+ci+ϵit
yXciϵ
H=(βfemβmale)(Var(βfem)Var(βmale))(βfemβmale)

Sin embargo, y este es un punto importante, todo este razonamiento solo es cierto si los dos modelos se especifican correctamente. Debería ser fácil encontrar variables omitidas específicas de género que varían con el tiempo y que afectan los salarios, por ejemplo, el nacimiento de un niño. Esto rompe inmediatamente la suposición principal de esta idea, así que sería cuidadoso con eso.

Andy
fuente