Tengo la siguiente función de probabilidad:
dónde
Mi modelo se parece
Esto se visualiza a través de una curva de probabilidad que se parece a la de abajo.
Estoy considerando agregar un par de variables a mi ecuación de regresión original. Digamos que agrego género (categórico: F y M) y edad (categórico: <25 y> 26) en el modelo, termino con:
En RI puedo generar una curva de probabilidad similar que me dirá la probabilidad de Y = 1 al tener en cuenta los tres predictores. Donde estoy perdido es que quiero encontrar las probabilidades para cada permutación posible de estas variaciones.
Entonces, cuando bid = 1, género = M y edad es> = 26, ¿cuál es la probabilidad de que Y = 1? De manera similar, cuando bid = 2, género = F y edad es> = 26, ¿cuál es la probabilidad de que Y = 1?
Quiero generar una curva de probabilidad que me permita visualizar esto.
¿Alguien puede ayudar? Puedo estar malentendiendo por completo qué tipo de información se puede obtener de un modelo logit, pero por favor dígame si también estoy malentendiendo la teoría.
fuente
Predict()
plot.Predict()
Respuestas:
Una situación más complicada es donde tienes más de una covariable continua. En un caso como este, a menudo hay una covariable particular que es 'primaria' en algún sentido. Esa covariable puede usarse para el eje X. Luego resuelve varios valores preespecificados de las otras covariables, típicamente la media y +/- 1SD. Otras opciones incluyen varios tipos de tramas 3D, tramas paralelas o tramas interactivas.
Mi respuesta a una pregunta diferente aquí tiene información sobre una variedad de gráficos para explorar datos en más de 2 dimensiones. Su caso es esencialmente análogo, excepto que está interesado en presentar los valores pronosticados del modelo, en lugar de los valores brutos.
Actualizar:
He escrito un código de ejemplo simple en R para hacer estos trazados. Permítanme señalar algunas cosas: debido a que la 'acción' se lleva a cabo temprano, solo ejecuté BID hasta 700 (pero siéntase libre de extenderla a 2000). En este ejemplo, estoy usando la función que especifique y tomo la primera categoría (es decir, femenina y joven) como categoría de referencia (que es la predeterminada en R). Como @whuber señala en su comentario, Los modelos LR son lineales en logaritmo de probabilidades, por lo que puede usar el primer bloque de valores predichos y trazar como lo haría con la regresión OLS si lo desea. El logit es la función de enlace, que le permite conectar el modelo a las probabilidades; el segundo bloque convierte las probabilidades de registro en probabilidades mediante el inverso de la función logit, es decir, exponiendo (convirtiendo en probabilidades) y luego dividiendo las probabilidades entre 1 + probabilidades. (Discutir la naturaleza de las funciones de enlace y este tipo de modelo aquí , si desea más información).
Lo que produce la siguiente gráfica:
Estas funciones son lo suficientemente similares como para que el enfoque de la gráfica de cuatro paralelos que describí inicialmente no sea muy distintivo. El siguiente código implementa mi enfoque 'alternativo':
produciendo a su vez, esta trama:
fuente