Probabilidades de regresión logística

8

He construido un modelo de regresión logística en R y, aunque el resultado parece ser satisfactorio hasta cierto punto, hay una pregunta que no he podido abordar. No estoy seguro de si mi enfoque es correcto.

Sé que el propósito general del modelo logístico es predecir la probabilidad de éxito de una variable aleatoria binaria. A partir del mismo modelo logístico, ¿es posible conocer la probabilidad de una proporción dada? Digamos, por ejemplo, que estamos interesados ​​en calcular la probabilidad de ser admitido en una escuela, y utilizamos una regresión logística para estimar esa probabilidad, que obviamente dependerá de algunas variables independientes. Mi pregunta es con el mismo modelo, ¿es posible estimar la proporción de estudiantes que serán admitidos en esa escuela en particular?

He tratado de usar la probabilidad binomial para responder eso, pero por alguna razón no me da la respuesta correcta. Cómo lo hice. Si conocemos la probabilidad de éxito, también sabemos que la variable dependiente sigue una distribución binomial con el parámetro N y P, donde N es el número de ensayos y P es la probabilidad de éxito que puede estimarse a partir del modelo logístico. Entonces, si quiero la probabilidad de que la proporción sea menor o igual a decir p, entonces pensé que esto es equivalente a la probabilidad de que en N ensayos haya menos o igual N * p éxito con la probabilidad de éxito siendo P.

PD: Sé que la probabilidad de éxito es una tasa / proporción general, pero lo que me interesa es averiguar la probabilidad para un determinado grupo. La característica del grupo podría incluirse en el modelo, pero eso sería limitante en mi caso. En realidad, estoy más interesado en encontrar la probabilidad de una proporción del modelo logístico en lugar del éxito de un determinado grupo.

Gracias

ThinkStatsme
fuente
77
Si he entendido esta pregunta, pregunta cómo utilizar un modelo logístico para estimar la distribución del número de estudiantes admitidos de un grupo específico de solicitantes. Se puede obtener dicho resultado , pero si está interesado en aplicarlo, entonces podría ser útil considerar algunos de los supuestos que podrían violarse. En particular, la computación de ese resultado debe suponer que la admisión de una persona no afectará las posibilidades de admitir a otras. Si la escuela tiene una cuota para ciertos tipos de solicitantes, ese no será el caso, por ejemplo.
whuber
@whuber, en parte quiero estimar el número de estudiantes admitidos de un grupo específico de solicitantes. También es de mayor interés, aunque puede que no lo haya redactado correctamente, ¿es posible asignar una probabilidad en la estimación de la tasa de éxito promedio del modelo logístico? Por ejemplo, si el éxito estimado para un caso es del 85%, ¿hay alguna forma de averiguar la probabilidad de que esto sea menos del 60%? ¿Tiene sentido ahora? Pensé que tal vez podría usar el error estándar en la predicción para responder eso, ¿sería correcto?
ThinkStatsme

Respuestas:

1

Si entiendo su pregunta correctamente, ¿ha predicho la probabilidad para cada individuo, pero quiere saber la probabilidad promedio de un segmento de esos individuos? Por ejemplo, tiene 1000 personas con una tasa promedio de 65% pero solo 300 tienen ojos azules, ¿cuál es la tasa promedio de las personas con ojos azules? Luego, simplemente puede promediar sus probabilidades estimadas para aquellos con ojos azules.

Josh
fuente