Pregunta simple: ¿Cómo especificar una distribución lognormal en el argumento de la familia GLM en R? No pude encontrar cómo se puede lograr esto. ¿Por qué lognormal (o exponencial) no es una opción en el argumento familiar?
En algún lugar de los R-Archives leí que uno simplemente tiene que usar el enlace de registro para la familia establecida en gaussiano en el GLM, para especificar un lognormal. Sin embargo, esto no tiene sentido porque se ajustará a una regresión no lineal y R comienza a pedir valores iniciales.
¿Alguien sabe cómo establecer una distribución lognormal (o exponencial) para un GLM?
Respuestas:
El paquete gamlss le permite ajustar modelos aditivos generalizados con distribuciones tanto lognormales como exponenciales, y muchos otros, con cierta variedad en funciones de enlace y utilizando, si lo desea, modelos semi o no paramétricos basados en splines penalizadas. Tiene algunos documentos publicados sobre los algoritmos utilizados y documentación y ejemplos vinculados al sitio al que me he vinculado.
fuente
Con respecto al ajuste del modelo exponencial con
glm
: Cuando se usa laglm
función con familia = Gamma, también es necesario usar las funciones de soporte desummary.glm
para fijar el parámetro de dispersión a 1:Y como iba a señalar pero jbowman me ganó, el (los) paquete (s) "gamlss" proporciona un ajuste log-normal:
fuente
glm
, sino con las matemáticas, ... y si tiene estimaciones de parámetros, la construcción de residuos es trivial en R. Publique esa pregunta en SO con una etiqueta [r] y usted seguramente obtendrá una respuesta rápida.Lognormal no es una opción porque la distribución log-normal no está en la familia exponencial de distribuciones. Los modelos lineales generalizados solo pueden ajustarse a distribuciones de la familia exponencial.
Estoy menos claro por qué exponencial no es una opción, ya que la distribución exponencial está en la familia exponencial (como es de esperar). Otro software estadístico con el que estoy familiarizado permite ajustar la distribución exponencial como un GLM al tratarla como un caso especial de la distribución Gamma con el parámetro de forma (también conocido como escala o dispersión) fijado en 1 en lugar de estimado.
glm()
Sin embargo, no puedo ver una forma de arreglar este parámetro usando la función de R. Una alternativa sería utilizar lasurvreg()
función delsurvival
paquete condist="exponential"
.fuente
La instalación de un GLM log-normal no tiene nada que ver con la distribución ni la opción de enlace de la
glm()
función. El término "log-normal" es bastante confuso en este sentido, pero significa que la variable de respuesta está normalmente distribuida (familia = gaussiana), y una transformación se aplica a esta variable de la siguiente manera:Sin embargo, cuando se compara esta glm log-normal con otras glms que utilizan una distribución diferente (por ejemplo, gamma), la función AIC () debe corregirse. ¿Alguien conocería una alternativa a estos AIC erróneos (), en este caso?
fuente
Intenta usar el siguiente comando:
Funciona aquí y el AIC parece ser correcto.
fuente