Estoy tratando de entender el uso de la regresión logística en tablas de contingencia 2x2 e Ix2. Por ejemplo, usando esto como un ejemplo
¿Cuál es la diferencia entre usar la prueba de chi-cuadrado y usar la regresión logística? ¿Qué pasa con una tabla con múltiples factores nominales (tabla Ix2) como esta:
Hay una pregunta similar aquí - pero la respuesta es principalmente que el chi-cuadrado puede manejar tablas de pesos, pero mi pregunta es ¿cuál es specificalyl para cuando hay un resultado binario y un solo factor nominal. (El hilo vinculado también se refiere a este hilo , pero esto se refiere a múltiples variables / factores).
Si es solo un factor único (es decir, no es necesario controlar otras variables) con una respuesta binaria, ¿cuál es la diferencia de propósito de hacer una regresión logística?
fuente
Respuestas:
En definitiva, son manzanas y naranjas.
La regresión logística es una forma de modelar una variable nominal como un resultado probabilístico de una o más de otras variables. El ajuste de un modelo de regresión logística podría seguirse con la prueba de si los coeficientes del modelo son significativamente diferentes de 0, calculando los intervalos de confianza para los coeficientes o examinando qué tan bien el modelo puede predecir nuevas observaciones.
La prueba de independencia χ² es una prueba de significación específica que prueba la hipótesis nula de que dos variables nominales son independientes.
Si debe usar la regresión logística o una prueba de χ² depende de la pregunta que desea responder. Por ejemplo, una prueba de χ² podría verificar si no es razonable creer que el partido político registrado de una persona es independiente de su raza, mientras que la regresión logística podría calcular la probabilidad de que una persona con una raza, edad y género pertenezca a cada partido político. .
fuente