Después de recopilar comentarios valiosos de preguntas y debates anteriores, se me ocurrió la siguiente pregunta: supongamos que el objetivo es detectar diferencias de efectos en dos grupos, por ejemplo, hombres contra mujeres. Hay dos maneras de hacerlo:
ejecutar dos regresiones separadas para los dos grupos, y emplear la prueba de Wald para rechazar (o no) la hipótesis nula : b 1 - b 2 = 0 , donde b 1 es el coeficiente de un IV en la regresión masculina, y b 2 es El coeficiente de la misma IV en la regresión femenina.
agrupe a los dos grupos y ejecute un modelo conjunto al incluir una referencia ficticia de género y un término de interacción (IV * genderdummy). Luego, la detección del efecto grupal se basará en el signo de interacción y la prueba t de significación.
¿Qué pasa si se rechaza Ho en el caso (1), es decir, la diferencia de grupo es significativa, pero el término del coeficiente de interacción en el caso (2) es estadísticamente insignificante, es decir, la diferencia de grupo es insignificante? O viceversa, Ho no se rechaza en el caso (1), y el término de interacción es significativo en el caso (2). Terminé con este resultado varias veces, y me preguntaba qué resultado sería más confiable y cuál es la razón detrás de esta contradicción.
¡Muchas gracias!
Respuestas:
El primer modelo interactuará completamente con el género con todas las demás covariables en el modelo. Esencialmente, el efecto de cada covariable (b2, b3 ... bn). En el segundo modelo, el efecto del género solo interactúa con su IV. Entonces, suponiendo que tenga más covariables que solo el IV y el género, esto puede generar resultados algo diferentes.
Si solo tiene las dos covariables, hay ocasiones documentadas en las que la diferencia en la maximización entre la prueba de Wald y la prueba de razón de probabilidad conduce a diferentes respuestas (ver más en la wikipedia ).
En mi propia experiencia, trato de guiarme por la teoría. Si hay una teoría dominante que sugiera que el género interactuaría solo con el IV, pero no con las otras covariables, iría con la interacción parcial.
fuente
Cada vez que se utilizan dos procedimientos diferentes para probar una hipótesis particular, habrá valores p diferentes. Decir que uno es significativo y el otro no puede ser simplemente tomar una decisión en blanco y negro al nivel 0.05. Si una prueba da un valor p de 0.03 y la otra dice 0.07, no llamaría a los resultados contradictorios. Si va a ser tan estricto al pensar en la importancia, es fácil que surja la situación (i) o (ii) cuando la importancia de la junta es el caso.
Como mencioné en respuesta a la pregunta anterior, mi preferencia por buscar una interacción es hacer una regresión combinada.
fuente
En el segundo caso, el software estándar le sugeriría un t-stat con valores de t-student, mientras que para el primer caso las pruebas de Wald pueden tener dos opciones. En el supuesto de normalidad de errores, el estadístico de Wald sigue un estadístico exacto de Fisher (que es equivalente al estadístico t, ya que supone la normalidad del error). Mientras que bajo la normalidad asintótica, el estadístico de Wald sigue una distribución Chi2 (que es análoga a la estadística t-t que sigue una distribución normal de manera asimétrica) ¿Qué distribución está asumiendo? Dependiendo de esto, sus valores p corren el riesgo de darle resultados diferentes.
En los libros de texto, encontrará que para las pruebas individuales bilaterales (un parámetro), las estadísticas de t-student y Fisher son equivalentes.
Si su muestra no es grande, entonces comparar los valores de chi2 y t-stat arrojaría resultados diferentes con certeza. En ese caso, asumir una distribución asintótica no sería razonable. Si su muestra es bastante pequeña, entonces suponiendo que la normalidad parece más razonable, esto implica valores t-stat y Fisher para los casos 2 y 1 respectivamente.
fuente