Tengo el siguiente modelo lineal generalizado. El objeto glmDV
se modela como una proporción de éxitos sobre las pruebas totales. Los objetos x_i
son variables continuas.
¿Cómo se ve esto en notación matemática?
winp.glm = glm(glmDV ~ x1 + x2 + x3 + x4 + x5 + x6 + x7,
data=myData, family=binomial("logit"))
r
generalized-linear-model
logit
notation
user2205916
fuente
fuente
0
s &1
s (lo que deduzco es lo que tiene en función de su descripción), debe usar unweights
argumento w / ? Glm , donde los pesos son el número de ensayos totales para cada observaciónRespuestas:
Para una regresión logística binaria, el caso de uso habitual para el GLM binomial con un enlace logit, está modelando la probabilidad de que su variable dependiente sea un "éxito" (o "sí"), convencionalmente codificado como . La forma en que está haciendo esto es modelando las probabilidades de registro. Entonces, en lugar de modelar la media de la respuesta como en OLS, está modelando el cambio en las probabilidades de registro:1
Donde y .logit ( x ) = log(X1 - x) logit- 1( x ) =Exp( x )1 + exp( x )
Una explicación más completa y muy accesible de esto se puede encontrar en Agresti, Introducción al análisis de datos categóricos.
Pero a su pregunta particular, usted declara que está modelando la proporción de éxitos. Esto no es realmente lo que un GLM binomial está acostumbrado a hacer. Sin embargo, lo que realmente buscas es lo que hace un GLM binomial, y aún es posible en R. Solo requiere un ligero ajuste a lo que estás haciendo. En el caso de que tenga un número finito de pruebas que pueden tener éxitos, aún puede usar el mismo modelo, que tiene densidad Debido a que sus valores están fijados por diseño experimental, son sus éxitos observados, está realizando inferencia en el parámetronorte y∈ { 0 ... n }
En términos de R, simplemente cree un objeto (que ustedy n - y
glmDV
llama) que es una matriz de 2 columnas, la primera columna el número de éxitos y el segundo el número total de fallas . ¡El resto de la declaración sigue siendo la misma!fuente
glm
y, que yo sepa, solo acepta una variable de respuesta de 1 columna, no dos columnas. Corríjame si estoy equivocado y, si es posible, cite documentación relevante. ¡Gracias!glm
documentación. Una buena manera de aprender cómo funcionan las funciones R es buscar en Google el nombre de la función; esto generalmente muestra la documentación relevante. También puede escribir?glm
en una consola R