Estoy llevando a cabo una regresión de Poisson con el objetivo final de comparar (y tomar la diferencia de) los recuentos medios pronosticados entre dos niveles de factores en mi modelo: , mientras otras covariables modelo (que son todas binarias) constantes. Me preguntaba si alguien podría proporcionar algún consejo práctico sobre cuándo usar un enlace de registro frente a un enlace de identidad. ¿Cuáles son las ventajas y desventajas de estas dos funciones de enlace diferentes en la regresión de Poisson, dado mi objetivo de comparar diferencias?
También tengo el mismo objetivo en mente para una regresión logística / binomial (usar un enlace logit o un enlace de identidad) para comparar la diferencia de proporciones entre dos niveles de factores y necesito un consejo similar. He leído algunas de las publicaciones aquí que abordan este tema, pero ninguna parece explicar por qué o cuándo uno podría elegir un enlace sobre el otro y cuáles podrían ser los pros / contras. ¡Gracias de antemano por tu ayuda!
ACTUALIZAR:
También me doy cuenta de que el propósito principal de usar ciertas funciones de enlaces es restringir el rango de rango de posibles valores pronosticados para que esté dentro del rango de la respuesta media (por ejemplo, para logística, el rango está restringido entre 0 y 1 y para el registro enlace, las predicciones están restringidas a números positivos). Entonces, supongo que lo que pregunto es que si uso un enlace de identidad para decir una regresión logística / binomial, y mis resultados están dentro del rango (0,1), ¿realmente hay alguna necesidad de usar una función de enlace logístico o ¿podría simplificar las ideas y utilizar un enlace de identidad?
fuente
Respuestas:
Los contras de un enlace de identidad en el caso de la regresión de Poisson son:
Pero, en última instancia, esta es una pregunta empírica. Montar ambos modelos. Realice los controles que desee. Si el enlace de identidad tiene un AIC más bajo y funciona igual o mejor en todas sus otras comprobaciones, ejecute con el enlace de identidad.
En el caso del modelo logit frente al modelo de probabilidad lineal (es decir, a lo que se refiere como el enlace de identidad), la situación es mucho más sencilla. A excepción de algunos casos muy exóticos en econometría (que encontrará si realiza una búsqueda), el modelo logit es mejor: hace menos suposiciones y es lo que usa la mayoría de la gente. Usar el modelo de probabilidad lineal en su lugar estaría a punto de ser perverso.
Con respecto a la interpretación de los modelos, si está utilizando R, hay dos paquetes geniales que harán todo el trabajo pesado: efectos , que son súper fáciles de usar, y zelig , que es más difícil de usar pero genial si desea hacer predicciones .
fuente
En el caso de los modelos de Poisson, también diría que la aplicación a menudo dicta si sus covariables actuarían de forma aditiva (lo que implicaría un enlace de identidad) o multiplicativamente en una escala lineal (lo que implicaría un enlace logarítmico). Pero los modelos de Poisson con un enlace de identidad también normalmente tienen sentido y solo pueden ajustarse de manera estable si se imponen restricciones de no negatividad a los coeficientes ajustados; esto se puede hacer usando la
nnpois
función en eladdreg
paquete R o lannlm
función en elNNLM
paquete. Por lo tanto, no estoy de acuerdo en que uno deba ajustar los modelos de Poisson con una identidad y un enlace de registro y ver cuál termina teniendo el mejor AIC e inferir el mejor modelo basado en motivos puramente estadísticos, más bien, en la mayoría de los casos, lo dicta estructura subyacente del problema que se intenta resolver o los datos disponibles.Por ejemplo, en la cromatografía (análisis GC / MS) a menudo se mediría la señal superpuesta de varios picos con forma de Gauss aproximadamente y esta señal superpuesta se mide con un multiplicador de electrones, lo que significa que la señal medida es un recuento de iones y, por lo tanto, distribución de Poisson. Dado que cada uno de los picos tiene, por definición, una altura positiva y actúa de manera aditiva y el ruido es Poisson, un modelo de Poisson no negativo con enlace de identidad sería apropiado aquí, y un modelo de Poisson de enlace de registro sería completamente incorrecto. En ingeniería , la pérdida de Kullback-Leibler a menudo se usa como una función de pérdida para tales modelos, y minimizar esta pérdida es equivalente a optimizar la probabilidad de un modelo de Poisson de enlace de identidad no negativo (también hay otras medidas de divergencia / pérdida como la divergencia alfa o beta que tienen a Poisson como un caso especial).
A continuación se muestra un ejemplo numérico, que incluye una demostración de que un enlace de identidad regular sin restricciones Poisson GLM no encaja (debido a la falta de restricciones de no negatividad) y algunos detalles sobre cómo ajustar modelos de Poisson de enlace de identidad no negativos utilizando
nnpois
, aquí en el contexto de desconvolucionar una superposición medida de picos cromatográficos con ruido de Poisson sobre ellos usando una matriz covariable con bandas que contiene copias desplazadas de la forma medida de un solo pico. La no negatividad aquí es importante por varias razones: (1) es el único modelo realista para los datos disponibles (los picos aquí no pueden tener alturas negativas), (2) es la única forma de ajustar de manera estable un modelo de Poisson con enlace de identidad (como de lo contrario, las predicciones podrían ser negativas para algunos valores covariables, lo que no tendría sentido y daría problemas numéricos cuando uno intentara evaluar la probabilidad), (3) los actos de no negatividad para regularizar el problema de regresión y ayudan en gran medida a obtener estimaciones estables (p. ej. por lo general, no obtienes los problemas de sobreajuste como con la regresión sin restricciones ordinaria,las restricciones de no negatividad dan como resultado estimaciones más dispersas que con frecuencia están más cerca de la verdad básica; para el siguiente problema de desconvolución, por ejemplo, el rendimiento es casi tan bueno como la regularización de LASSO, pero sin requerir que uno ajuste ningún parámetro de regularización. (La regresión penalizada con pseudonorma L0 aún funciona un poco mejor pero a un costo computacional mayor )fuente