Dado que la Regresión logística es un modelo de clasificación estadística que trata con variables dependientes categóricas, ¿por qué no se llama Clasificación logística ? ¿No debería reservarse el nombre de "Regresión" a los modelos que manejan variables dependientes continuas?
regression
machine-learning
logistic
classification
terminology
Ismael Ghalimi
fuente
fuente
Respuestas:
La regresión logística no es enfáticamente un algoritmo de clasificación por sí solo. Es solo un algoritmo de clasificación en combinación con una regla de decisión que hace dicotómicas las probabilidades predichas del resultado. La regresión logística es un modelo de regresión porque estima la probabilidad de pertenencia a una clase como (transformación de a) una función multilineal de las características.
Frank Harrell ha publicado una serie de respuestas en este sitio web que enumeran las trampas de considerar la regresión logística como un algoritmo de clasificación. Entre ellos:
Si recuerdo bien, una vez me señaló su libro sobre estrategias de regresión para una mayor elaboración de estos (¡y más!) Puntos, pero parece que no puedo encontrar esa publicación en particular.
fuente
En resumen, la regresión es el problema de calcular una expectativa condicional . La forma adoptada por esta expectativa es diferente dependiendo de los supuestos de cómo se generaron los datos:E[Y|X=x]
El término "regresión" también se ha utilizado de manera más general que esto, incluidos enfoques como la regresión cuantil, que estima un cuantil dado de .(Y|X=x)
fuente
Además de las buenas respuestas ya proporcionadas, otra opinión es que la regresión logística predice las probabilidades (que es un valor continuo ) que tienen un rango de 0 a 1.
fuente