No entiendo cómo interpretar el coeficiente de una regresión de Poisson en relación con el coeficiente de una regresión OLS.
Supongamos que tengo datos de series de tiempo, mi variable del lado izquierdo es la cantidad de juegos ganados por año, y mi variable principal del lado derecho es el valor NASDAQ. Si mi especificación preferida es interpretar el modelo como en términos porcentuales, tomo la transformación de registro de los juegos ganados. También puedo tomar el registro del NASDAQ para decir cuánto aumentaría un 1 por ciento en el NASDAQ el porcentaje de juegos ganados. Ahora, reconozco que un modelo de Poisson podría tener sentido porque los datos de los juegos ganados son recuentos y no continuos. Ejecuto la regresión con muchas, muchas variables de control.
¿No haría una transformación de registro en los juegos ganados y en su lugar usaría solo juegos? Cuando obtengo los coeficientes, ¿hago algún tipo de cálculo de efectos marginales (como se puede hacer para probit)?
¿Cómo interpreto estos coeficientes?
¿Cómo comparo la interpretación del Poisson con la OLS, ya sea la OLS que se transforma con log o la OLS que no?
Sé que este tipo de preguntas ya se han hecho antes, pero aún no las entiendo.
fuente
Respuestas:
No es crítico, pero este es un ejemplo extraño. No está claro que realmente esté haciendo análisis de series de tiempo, ni lo que el NASDAQ tendría que ver con la cantidad de juegos ganados por algún equipo. Si está interesado en decir algo sobre la cantidad de juegos que ganó un equipo, creo que sería mejor usar la regresión logística binaria, dado que presumiblemente sabe cuántos juegos se juegan. La regresión de Poisson es más apropiada para hablar de conteos cuando el total posible no está bien restringido , o al menos no se conoce.
La forma en que interpretaría sus betas depende, en parte, del enlace utilizado: es posible usar el enlace de identidad, aunque el enlace de registro sea más común (y generalmente más apropiado). Si está utilizando el enlace de registro, probablemente no tomaría el registro de su variable de respuesta; en esencia, el enlace lo está haciendo por usted. Tomemos un caso abstracto, tiene un modelo de Poisson usando el enlace de registro de la siguiente manera:
(EDITAR: estoy eliminando los "sombreros" de las versiones beta en lo que sigue, porque son feos, pero aún deben entenderse).
Con la regresión OLS normal, está prediciendo la media de una distribución gaussiana de la variable de respuesta condicional a los valores de las covariables. En este caso, está prediciendo la media de una distribución de Poisson de la variable de respuesta condicional a los valores de las covariables. Para OLS, si un caso dado fuera 1 unidad más alto en su covariable, usted espera que, si todo es igual, la media de esa distribución condicional seaβ1 Unidades superiores. Aquí, si un caso dado fuera 1 unidad más alto, ceteris paribus , se espera que la media condicional seamiβ1 veces más alto Por ejemplo, diβ1= 2 , entonces en regresión normal es 2 unidades más alto (es decir, +2), y aquí es 7.4 veces más alto (es decir, x 7.4) En ambos casos,β0 0 es tu intercepción ; en nuestra ecuación anterior, considere la situación cuandox = 0 , entonces exp(β1)X= 1 , y el lado derecho se reduce a exp (β0 0 ), que te da la media de y cuando todas las covariables son iguales a 0.
Hay un par de cosas que pueden ser confusas al respecto. Primero, predecir la media de una distribución de Poisson no es lo mismo que predecir la media de un gaussiano. Con una distribución normal, la media es el valor más probable. Pero con el Poisson, la media es a menudo un valor imposible (por ejemplo, si su media pronosticada es 2.7, ese no es un conteo que podría existir). Además, normalmente la media no está relacionada con el nivel de dispersión (es decir, la DE), pero con la distribución de Poisson, la varianza necesariamente es igual a la media (aunque, en la práctica, a menudo no lo hace, lo que lleva a complejidades adicionales). Finalmente, esas exponenciaciones lo hacen más complicado; si, en lugar de un cambio relativo, quisiera saber el valor exacto, tendría que comenzar en 0 (es decir,miβ0 0 ) y multiplica tu camino X veces. Para predecir un valor específico, es más fácil resolver la expresión dentro de los paréntesis en la ecuación inferior y luego exponerla; esto hace que el significado de la beta sea menos claro, pero las matemáticas son más fáciles y reduce la posibilidad de error.
fuente