Regresión con solo variables categóricas

24

¿Es posible realizar una regresión si todas las variables dependientes e independientes son variables categóricas?

altruista
fuente
3
Ciertamente es posible, incluso para la regresión común o de jardín, siempre que la variable de respuesta (dependiente) se trate puramente numéricamente. Dependiendo de su software, es posible que deba presionar o forzar que eso suceda. Con una definición adecuada de regresión, para incluir la regresión logística u ordinal, no solo es posible, es común.
Nick Cox

Respuestas:

31

Necesitamos ser claros en nuestros términos aquí, pero en general, :

  • Si su variable dependiente es continua (y los residuos se distribuyen normalmente, vea aquí ), pero todas sus variables independientes son categóricas, esto es solo un ANOVA .
  • Si su variable dependiente es categórica y sus variables independientes son continuas, esto sería una regresión logística (posiblemente binaria, ordinal o multinomial , dependiendo).
  • Si tanto su variable dependiente como sus variables independientes son variables categóricas, aún puede usar la regresión logística, es una especie de versión ANOVA-ish de LR.

Tenga en cuenta que tanto la regresión logística como la regresión de mínimos cuadrados ordinarios (lineal) son casos especiales del Modelo lineal generalizado .

gung - Restablece a Monica
fuente
Es el tercer caso que usted mencionó, probé LR, ninguno de los coeficientes resultó ser significativo. Pensé que podría estar haciendo algo mal.
altruista
2
No creo que ANOVA requiera una variable dependiente continua más de lo que requiere residuos distribuidos normalmente. Estas son solo condiciones bajo las cuales se espera que ANOVA funcione bien.
Nick Cox
1
@ NickCox, tienes razón, por supuesto; estamos discutiendo sobre cómo definimos y aplicamos estos términos. La forma en que lo diría es que el modelo se deriva de esos supuestos, pero el ANOVA puede usarse incluso si no se cumplen, con la pregunta de si los resultados serán útiles dependiendo.
gung - Restablece a Monica
1
@altruist, expuse los tres casos en aras de la claridad conceptual; Reconozco que lo último es lo que quieres. Tenga en cuenta que si está utilizando el software correctamente para adaptarse al modelo y si sus coeficientes son 'significativos' o no, no tiene relación con si LR es o no el modelo apropiado para su situación.
gung - Restablece a Monica
44
Tenga en cuenta que ser categórico es a veces una cuestión de definición para el software, y a veces en la mente del espectador. ¿Cuál es el número de hijos, por ejemplo?
Nick Cox