Término de intercepción en regresión logística

14

Supongamos que tenemos el siguiente modelo de regresión logística:

logit(p)=β0+β1x1+β2x2

¿Es las probabilidades del evento cuando y ? En otras palabras, ¿son las probabilidades del evento cuando y están en los niveles más bajos (incluso si esto no es 0)? Por ejemplo, si y toman solo los valores y entonces no podemos establecerlos en 0.x 1 = 0 x 2 = 0 x 1 x 2 x 1 x 2 2 3β0x1=0x2=0x1x2x1x223

logisticgu
fuente
3
Creo que encontrará la respuesta en stats.stackexchange.com/questions/91402 como reveladora y útil. Con cambios menores, se aplica directamente a su situación.
whuber
1
@whuber: ¿Entonces en mi ejemplo, y están fuera de mi rango de datos? Y así y sin interpretación significativa. x 2 = 0 β 0x1=0x2=0β0
logisticgu

Respuestas:

24

x 1 = x 2 = 0 x 1 = x 2 = 0β0 no es la probabilidad del evento cuando , es el registro de las probabilidades . Además, son las probabilidades de registro solo cuando , no cuando están en sus valores más bajos distintos de cero. x1=x2=0x1=x2=0

gung - Restablece a Monica
fuente
Por lo tanto, no tiene una interpretación significativa en mi situación. β0
logisticgu
8
Por lo tanto, no tiene una interpretación independiente significativa en su situación. Ese es a menudo el caso. Sigue siendo una parte integral del modelo. Si lo eliminó del modelo, el resto del modelo (por ejemplo, la estimación de ) estaría sesgado. β 1β0β^1
gung - Restablece a Monica
3
(+1) Hay varias formas de hacer que la intercepción sea significativa. Por ejemplo, si está interesado en las probabilidades de registro cuando y , retroceda contra y . Por supuesto, obtendrá el mismo valor al conectar y en el modelo actual, dando , pero la salida de software predeterminada probablemente incluirá automáticamente una prueba para comparar esto a cero . x 3 = 3 p x 1 - 2 x 3 - 3 x 1 = 2 x 2 = 3 β 0 + 2 β 1 + 3 β 2x2=2x3=3px12x33x1=2x2=3β0+2β1+3β2
whuber
@gung: De manera similar, compara con cuando todas las demás variables se mantienen constantes. x 1 = 3 x 1 = 2exp(β1)x1=3x1=2
logisticgu
1
Sí, es la razón de probabilidades asociada con un cambio de 1 unidad en (puede ser cualquier conjunto de valores separados por 1 unidad) cuando todo lo demás se mantiene constante. x 1exp(β1)x1
gung - Restablece a Monica
4

También puede haber un caso en el que y no pueden ser iguales a al mismo tiempo. En este caso, no tiene una interpretación clara.x 2 0 β 0x1x20β0

De lo contrario, tiene una interpretación: cambia el registro de las probabilidades a su valor real, si ninguna variable no puede hacer esto.β0

Sergey Makarevich
fuente
Tenga en cuenta que aquí puede usar la composición tipográfica de látex encerrando el texto en signos de dólar, por ejemplo, $x^{2}$produce y produceβ 0x2$\beta_0$β0
Silverfish
0

Sugiero mirarlo de una manera diferente ...

En la regresión logística, predecimos alguna clase binaria {0 o 1} calculando la probabilidad de probabilidad, que es el resultado real de .logit(p)

Esto, por supuesto, supone que las probabilidades de registro pueden describirse razonablemente por una función lineal, por ejemplo,β0+β1x1+β2x2+

... Esta es una gran suposición, y solo a veces es cierta. Si esos componentes no tienen influencia proporcional independiente en las probabilidades de registro, entonces es mejor elegir otro marco estadístico. Es decir, las probabilidades de registro están formadas por algún componente fijo , y aumentan gradualmente por cada término sucesivo, .xiβ0βixi

En resumen, el valor es el "componente fijo" de ese método componentes para describir las probabilidades de registro de cualquier evento / condición que intente predecir. También recuerde que una regresión en última instancia describe algún promedio condicional, dado un conjunto de valores . Ninguna de esas cosas requiere que los valores sean 0 en sus datos o incluso posibles en la realidad. El simplemente desplaza esa expresión lineal hacia arriba o hacia abajo para que los componentes variables sean más precisos.β0xixiβ0

Tal vez dije lo mismo con una mentalidad ligeramente diferente, pero espero que esto ayude ...

Omeed
fuente