Estoy buscando modelar algunos datos, pero no estoy seguro de qué tipo de modelo puedo usar. Tengo datos de conteo y quiero un modelo que proporcione estimaciones paramétricas tanto de la media como de la varianza de los datos. Es decir, tengo varios factores predictivos y quiero determinar si alguno de ellos influye en la varianza (no solo la media del grupo).
Sé que la regresión de Poisson no funcionará porque la varianza es igual a la media; Esta suposición no es válida en mi caso, así que sé que hay una sobredispersión. Sin embargo, un modelo binomial negativo solo genera un único parámetro de sobredispersión, no uno que sea función de los predictores en el modelo. ¿Qué modelo puede hacer esto?
Además, se agradecería una referencia a un libro o documento que discuta el modelo y / o un paquete R que implemente el modelo.
fuente
Respuestas:
Puede modelar el parámetro de dispersión binomial negativa en sí mismo en función de variables y parámetros utilizando el paquete gamlss en R. Proporciono un extracto de una introducción a él:
El sitio web www.gamlss.org tiene documentación y enlaces a varios documentos sobre los enfoques utilizados en el paquete.
fuente
Stata proporciona el comando -gnbreg-, que le permite modelar el parámetro de dispersión. Puede ver la ayuda de Stata para el comando en http://www.stata.com/help.cgi?nbreg
Stata llama a esto el modelo binomial negativo generalizado. Joseph Hilbe lo analiza en su libro "Regresión binomial negativa", sección 10.4, como "NB-H: regresión binomial negativa heterogénea".
fuente