He estado pensando en este problema. La función logística habitual para modelar datos binarios es: Sin embargo, ¿es la función logit, que es una curva en forma de S, siempre la mejor para modelar los datos? Tal vez tenga razones para creer que sus datos no siguen la curva en forma de S normal sino un tipo diferente de curva con dominio(0,1).
¿Hay alguna investigación sobre esto? Tal vez pueda modelarlo como una función probit o algo similar, pero ¿y si es algo completamente diferente? ¿Podría esto conducir a una mejor estimación de los efectos? Solo un pensamiento que tuve, y me pregunto si hay alguna investigación sobre esto.
logistic
references
link-function
Cañada
fuente
fuente
Respuestas:
Las personas usan todo tipo de funciones para mantener sus datos entre 0 y 1. Las probabilidades de registro se deducen naturalmente de las matemáticas cuando deriva el modelo (se llama "función de enlace canónico"), pero es absolutamente libre de experimentar con Otras alternativas.
Como Macro aludió en su comentario sobre su pregunta, una opción común es un modelo probit , que utiliza la función cuantil de un gaussiano en lugar de la función logística. También he escuchado cosas buenas sobre el uso de la función cuantil de una distribución de Student , aunque nunca lo he intentado.t
Espero que esto ayude.
Editado para agregar : La discusión a la que se vinculó @Macro es realmente excelente. Recomiendo leerlo si está interesado en obtener más detalles.
fuente
No veo ninguna razón, a priori, por la cual la función de enlace apropiada para un conjunto de datos dado debe ser el logit (aunque el universo parece ser bastante amable con nosotros en general). No sé si esto es lo que estás buscando, pero aquí hay algunos documentos que analizan funciones de enlace más exóticas:
Cauchit (etc.):
Koenker, R. y Yoon, J. (2009). Enlaces paramétricos para modelos de elección binaria: un coloquio pescador-bayesiano . Journal of Econometrics, 152, 2 , págs. 120-130.
Koenker, R. (2006). Enlaces paramétricos para modelos de elección binaria . Rnews, 6, 4 , pp. 32-34.
Scobit :
Nagler, J. (1994). Scobit: un estimador alternativo para logit y probit . American Journal of Political Science, 38, 1 , págs. 230-255.
Skew-Probit :
Bazan, JL, Bolfarine, H. y Branco, MD (2010). Un marco para enlaces sesgados-probit en regresión binaria . Comunicaciones en estadística: teoría y métodos, 39 , pp. 678-697.
(Esto parece una buena descripción de los enlaces asimétricos dentro de un marco bayesiano) :
Chen, MH (2004). Modelos de enlaces sesgados para datos de respuesta categórica . En Distribuciones elípticas oblicuas y sus aplicaciones: un viaje más allá de la normalidad , Marc Genton, editor. Chapman y Hall.
Divulgación: no conozco bien este material. Intenté incursionar con Cauchit y Scobit hace un par de años, pero mi código seguía fallando (probablemente porque no soy un gran programador), y no parecía relevante para el proyecto en el que estaba trabajando, así que lo dejé caer. .
fuente
La mejor estrategia es modelar los datos a la luz de lo que está sucediendo (¡no es sorpresa!)
Probablemente no haya investigaciones sobre estos modelos como tales, aunque ha habido mucha investigación sobre cualquiera de estos modelos, y sobre las comparaciones entre ellos, y sobre diferentes formas de estimarlos. Lo que encuentra en la literatura es que hay mucha actividad por un tiempo, ya que los investigadores consideran una serie de opciones para una clase particular de problemas, y luego un método emerge como superior.
fuente
fuente