Veo el razonamiento detrás de este consejo, pero i) esta persona debería haberte explicado mejor y ii) también deberían haber mencionado los supuestos restrictivos que subyacen a esta idea.
En la prueba de Hausman, generalmente pregunta si hay una diferencia entre un modelo consistente pero ineficiente y un modelo potencial inconsistente que es más eficiente. En el caso estándar en el que se comparan los efectos fijos y aleatorios, el estimador de efectos fijos es consistente independientemente de que los efectos individuales estén o no correlacionados con las otras variables explicativas, pero es menos eficiente que el estimador de efectos aleatorios, que solo es consistente para efectos fijos no correlacionados con variables explicativas.
Cualquiera de los dos grupos (masculino o femenino) tendrá menos observaciones. A priori, supongo que este es el grupo femenino. Entonces, si ejecuta la misma especificación de regresión
donde es ganancias, son las mismas variables explicativas de variante de tiempo, son las efectos fijos individuales y es un error estocástico, entonces una diferencia entre los modelos masculino y femenino implicaría que existe un tratamiento diferente de hombres y mujeres en términos de salarios. Las estadísticas de la prueba en este caso serían
yyo t= α + X'yo tβ+Cyo+ϵyo t
yXCyoϵH=(βfem−βmale)′(Var(βfem)−Var(βmale))(βfem−βmale)
Sin embargo, y este es un punto importante, todo este razonamiento solo es cierto si los dos modelos se especifican correctamente. Debería ser fácil encontrar variables omitidas específicas de género que varían con el tiempo y que afectan los salarios, por ejemplo, el nacimiento de un niño. Esto rompe inmediatamente la suposición principal de esta idea, así que sería cuidadoso con eso.