¿Qué es theta en una regresión binomial negativa con R?

26

Tengo una pregunta sobre una regresión binomial negativa: supongamos que tiene los siguientes comandos:

require(MASS)
attach(cars)
mod.NB<-glm.nb(dist~speed)
summary(mod.NB)
detach(cars)

(Tenga en cuenta que los automóviles son un conjunto de datos que está disponible en R, y realmente no me importa si este modelo tiene sentido).

Lo que me gustaría saber es: ¿Cómo puedo interpretar la variable theta(como se devuelve al final de una llamada a summary)? ¿Es este el parámetro de forma de la distribución negbin y es posible interpretarlo como una medida de asimetría?

MarkDollar
fuente
Un resumen de lo que dice MASS está aquí .
Scortchi - Restablece a Monica

Respuestas:

17

Sí, thetaes el parámetro de forma de la distribución binomial negativa, y no, realmente no se puede interpretar como una medida de asimetría. Más precisamente:

  • la asimetría dependerá del valor de theta, pero también de la media
  • no hay valor de thetaeso te garantizará falta de sesgo

Si no lo estropeé, en la mu/ thetaparametrización utilizada en la regresión binomial negativa, la asimetría es

Skmiw(nortesi)=θ+2μθμ(θ+μ)=1+2μθμ(1+μθ)

En este contexto, generalmente se interpreta como una medida de sobredispersión con respecto a la distribución de Poisson. La varianza del binomio negativo es μ + μ 2 / θ , por lo que θ realmente controla el exceso de variabilidad en comparación con Poisson (que sería μ ), y no la inclinación.θμ+μ2/ /θθμ

Aniko
fuente
gracias hasta ahora! Esta es una buena ayuda ... Pero: ¿Cómo puedo interpretar los valores altos o (bajos) de theta? En el libro de McCaullaughs modelos lineales generalizados hay un enlace a este artículo de anscombe para hacer una interpretación de k. Pero desafortunadamente no lo entiendo realmente. El documento es claremontmckenna.edu/facultysites/math/FacMember/MOneill/…
MarkDollar
Solo tienes que leer la primera página. Entonces theta (o k en anscombe) es el parámetro de forma de la distribución negbin y administra, si la distribución está más cerca de gamma (k -> 0) o poisson (k -> infinito). Pero, ¿qué significa para el ajuste? ¿Cómo puedo interpretar theta por ejemplo para la estimación de automóviles?
MarkDollar
33

Uno de mis alumnos me recomendó a este sitio en mi curso de Modeling Count Data . Parece haber mucha información errónea sobre el modelo binomial negativo, y especialmente con respecto a la estadística de dispersión y al parámetro de dispersión.

μglmglm.nb θ

glm.nbglmμ+μ2θμ+αμ2glm.nbglmglm.nbaparentemente tomó la relación indirecta de McCullagh y Nelder, pero Nelder (quien fue cofundador de GLM en 1972) escribió su complemento de sistema kk para Genstat en 1993 en el que argumentó que se prefiere la relación directa. Él y su esposa solían visitarme a mí y a mi familia cada dos años en Arizona, desde principios de 1993 hasta el año anterior a su muerte. Discutimos esto bastante a fondo, ya que había puesto una relación directa en el programa glm que escribí a fines de 1992 para el software Stata y Xplore, y para una macro SAS en 1994.

nbinomialαθnbinomial

Joseph Hilbe
fuente
2
Gracias por esta aclaración. Supongo que un problema para estos malentendidos proviene de la salida R del tipo en el que se lee "(Parámetro de dispersión para la familia Binomial Negativa (theta) tomada como 1)". Aquí la dispersión se refiere a en c o v (ϕdoov(β^)=ϕ(XTŴ^X)-1θμθ"forma", la última de las cuales no me parece irrazonable ya que ciertamente influye en la forma.
Momo
¿Cuál es el rango de theta? ¿Theta tiene que ser un valor mayor que uno?
News_is_Selection_Bias
2

binomio negativo de referencia glm: ingrese la descripción de la imagen aquí

El binomio negativo de Wikipedia 'r' es 'theta' de glm, lo que implica que glm 'theta' es el parámetro de forma. En términos simples, el 'theta' de glm es un número de fallas.

datageek
fuente