¿Por qué usaríamos probabilidades en lugar de probabilidades al realizar una regresión logística?
fuente
¿Por qué usaríamos probabilidades en lugar de probabilidades al realizar una regresión logística?
La ventaja es que las probabilidades definidas en asignan a las probabilidades de registro en , mientras que este no es el caso de las probabilidades. Como resultado, puede usar ecuaciones de regresión como para el registro -odds sin ningún problema (es decir, para cualquier valor de los coeficientes de regresión y covariables se predice un valor válido para las probabilidades). Necesitaría restricciones multidimensionales extremadamente complicadas en los coeficientes de regresión
La probabilidad es el número esperado de "éxitos" por "fracaso", por lo que puede tomar valores inferiores a uno, uno o más de uno, pero los valores negativos no tendrán sentido; puedes tener 3 éxitos por falla, pero -3 éxitos por falla no tiene sentido. El logaritmo de una probabilidad puede tomar cualquier valor positivo o negativo. La regresión logística es un modelo lineal para el registro (probabilidades). Esto funciona porque el registro (probabilidades) puede tomar cualquier número positivo o negativo, por lo que un modelo lineal no conducirá a predicciones imposibles. Podemos hacer un modelo lineal para la probabilidad, un modelo de probabilidad lineal, pero eso puede conducir a predicciones imposibles ya que la probabilidad debe permanecer entre 0 y 1.