¿Por qué usar probabilidades y no probabilidades en regresión logística?

8

¿Por qué usaríamos probabilidades en lugar de probabilidades al realizar una regresión logística?

Kenny
fuente

Respuestas:

22

La ventaja es que las probabilidades definidas en asignan a las probabilidades de registro en , mientras que este no es el caso de las probabilidades. Como resultado, puede usar ecuaciones de regresión como para el registro -odds sin ningún problema (es decir, para cualquier valor de los coeficientes de regresión y covariables se predice un valor válido para las probabilidades). Necesitaría restricciones multidimensionales extremadamente complicadas en los coeficientes de regresión(0 0,)(-,)

Iniciar sesión(pagsyo1-pagsyo)=β0 0+j=1JβjXyoj
β0 0,β1,..., si desea hacer lo mismo para la probabilidad de registro (y, por supuesto, esto tampoco funcionaría de manera directa para la probabilidad o las probabilidades no transformadas). Como consecuencia, obtiene efectos como no poder tener una razón de riesgo constante en todas las probabilidades de referencia (algunas razones de riesgo darían lugar a probabilidades> 1), mientras que esto no es un problema con una razón de probabilidades.
Björn
fuente
17

La probabilidad es el número esperado de "éxitos" por "fracaso", por lo que puede tomar valores inferiores a uno, uno o más de uno, pero los valores negativos no tendrán sentido; puedes tener 3 éxitos por falla, pero -3 éxitos por falla no tiene sentido. El logaritmo de una probabilidad puede tomar cualquier valor positivo o negativo. La regresión logística es un modelo lineal para el registro (probabilidades). Esto funciona porque el registro (probabilidades) puede tomar cualquier número positivo o negativo, por lo que un modelo lineal no conducirá a predicciones imposibles. Podemos hacer un modelo lineal para la probabilidad, un modelo de probabilidad lineal, pero eso puede conducir a predicciones imposibles ya que la probabilidad debe permanecer entre 0 y 1.

Maarten Buis
fuente