Modelos binarios (Probit y Logit) con un desplazamiento logarítmico

12

¿Alguien tiene una derivación de cómo funciona un desplazamiento en modelos binarios como probit y logit?

En mi problema, la ventana de seguimiento puede variar en longitud. Supongamos que los pacientes reciben una inyección profiláctica como tratamiento. El tiro sucede en diferentes momentos, por lo que si el resultado es un indicador binario de si alguna brotes ocurrieron necesita ajustar por el hecho de que algunas personas tienen más tiempo para los síntomas de exposición. Parece que la probabilidad de un brote es proporcional a la duración del período de seguimiento. No me queda claro matemáticamente cómo un modelo binario con un desplazamiento captura esta intuición (a diferencia del Poisson).

El desplazamiento es una opción estándar tanto en Stata (p.1666) como en R , y puedo verlo fácilmente para un Poisson , pero el caso binario es un poco opaco.

Por ejemplo, si tenemos

E[y|x]Z=exp{xβ},
esto es algebraicamente equivalente a un modelo donde
E[y|x]=exp{xβ+logZ},
que es el modelo estándar con el coeficiente enlogZlimitado a1. Esto se llamadesplazamiento logarítmico. Tengo problemas para descubrir cómo funciona esto si reemplazamosexp{}conΦ()oΛ() .

Actualización n. ° 1:

El caso logit se explica a continuación.

Actualización n. ° 2:

βx=2z=2xxz

Dimitriy V. Masterov
fuente

Respuestas:

8

Siempre puede incluir un desplazamiento en cualquier GLM: es solo una variable predictiva cuyo coeficiente se fija en 1. La regresión de Poisson resulta ser un caso de uso muy común.

Tenga en cuenta que en un modelo binomial, el análogo a la exposición logarítmica como compensación es solo el denominador binomial, por lo que generalmente no es necesario especificarlo explícitamente. Del mismo modo que puede modelar un RV Poisson como un recuento con la exposición logarítmica como compensación, o como una relación con la exposición como un peso, también puede modelar un RV binomial como recuentos de éxitos y fracasos, o como una frecuencia con ensayos como un peso.

logZZp/(1p)

log(p/(1p))=βX+logZp/(1p)=Zexp(βX)

Pero esto no tiene ningún significado particular como lo hace la exposición logarítmica en una regresión de Poisson. Dicho esto, si su probabilidad binomial es lo suficientemente pequeña, un modelo logístico se acercará a un modelo de Poisson con enlace de registro (ya que el denominador en el LHS se aproxima a 1) y el desplazamiento puede tratarse como un término de exposición logarítmica.

(El problema descrito en su pregunta R vinculada fue bastante idiosincrásico).

Hong Ooi
fuente
t tPr(Y=1|X)=Φ(xβ+ln(t))tt
No es la probabilidad, sino la razón de posibilidades. Esperemos que la edición lo haga más claro.
Hong Ooi
Expresar el problema en términos de odds ratio lo deja muy claro. ¿Qué pasa con el probit?
Dimitriy V. Masterov
No esperaría que esto funcione para probit, o al menos tenga una interpretación limpia, ya que no es un enlace canónico, y una variable dependiente binaria con probit no cae en la familia exponencial. Φ()
StasK
@StasK Eso parece correcto, pero ¿por qué existen estas opciones en Stata y R? ¿Qué logran?
Dimitriy V. Masterov
1

Reformulando esto como un problema de tiempo hasta el evento, ¿un modelo logístico con un desplazamiento de ln (tiempo) no lo comprometería efectivamente a una función de supervivencia paramétrica que puede o no ajustarse bien a los datos?

p / (1-p) = Z * exp (xbeta)

p = [Z * exp (xbeta)] / [1 + Z * exp (xbeta)]

Supervivencia prevista en el tiempo Z = 1- [Z * exp (xbeta)] / [1 + Z * exp (xbeta)]

Eric
fuente