¿Cuál es la diferencia entre la regresión binomial y la regresión logística?

20

Siempre he pensado en la regresión logística como simplemente un caso especial de regresión binomial donde la función de enlace es la función logística (en lugar de, por ejemplo, una función probit).

Sin embargo, al leer las respuestas sobre otra pregunta que tenía, parece que podría estar confundido, y hay una diferencia entre la regresión logística y la regresión binomial con un enlace logístico.

¿Cual es la diferencia?

raegtin
fuente

Respuestas:

13

La regresión logística es una regresión binomial con la función de enlace "logístico":

g(p)=log(p1p)=Xβ

Aunque también creo que la regresión logística generalmente se aplica a proporciones binomiales en lugar de conteos binomiales.

probabilidadislogica
fuente
1
¿Qué quiere decir con regresión logística que se aplica generalmente a proporciones en lugar de conteos? Supongamos que estoy tratando de predecir si las personas asistirán a una fiesta o no, y que para una fiesta en particular, sé que asistieron 9 personas y 1 no, ¿quiere decir que la regresión logística toma esto como un ejemplo de capacitación (es decir, esta parte tuvo una tasa de éxito de 0.9), mientras que la regresión binomial con un enlace tomaría esto como 10 ejemplos de entrenamiento (9 éxitos, 1 fracaso)?
raegtin
@raehtin: en ambos casos sería muestra / caso de entrenamiento, con ( n i , f i ) = ( 10 , 0.9 ) y ( n i , x i ) = ( 10 , 9 ) respectivamente. La diferencia es la forma de las funciones de media y varianza. Para binomial, la media es μ i = n i p i , el enlace canoncial ahora es log ( μ i1(ni,fi)=(10,0.9)(ni,xi)=(10,9)μi=nipi(también llamado "parámetro natural"), y la función de varianza esV(μi)=μi(ni-μi)log(μiniμi) con el parámetro de dispersiónϕi=1. Para logística tenemos mediaμi=pi, el enlace anterior, función de varianza deV(μi)=μi(1-μi)y dispersión igual aϕi=1V(μi)=μi(niμi)niϕi=1μi=piV(μi)=μi(1μi) . ϕi=1ni
probabilityislogic
Con la logística, el se separa de las funciones de media y varianza, por lo que se puede tener en cuenta más fácilmente a través de la ponderaciónni
Probabilidad
Ah, lo tengo, creo que ya veo. ¿Significa esto que producen resultados equivalentes (simplemente obtenidos de una manera diferente)?
raegtin
1
@raegtin - Creo que sí. Los pesos GLM, , son iguales en ambos casos, y la función de enlace produce el mismo valor logit. Entonces, siempre que las variables X también sean las mismas, entonces debería dar los mismos resultados. wi2=1ϕiV(μi)[g(μi)]2
probabilityislogic
4

Regresión binomial es cualquier tipo de GLM utilizando una relación media-varianza binomial donde la varianza está dada por . En regresión logística la Y = logit - 1 ( X β ) = 1 / ( 1 - exp ( X β )var(Y)=Y^(1Y^)Y^=logit1(Xβ^)=1/(1exp(Xβ^))[0,1]

AdamO
fuente