Necesito ajustar una distribución gaussiana generalizada a una nube de puntos de 7 luces que contiene un número bastante significativo de valores atípicos con un alto apalancamiento. ¿Conoces algún buen paquete R para este trabajo?
r
distributions
normal-distribution
robust
kjetil b halvorsen
fuente
fuente
Respuestas:
También hay mclust: http://www.stat.washington.edu/research/reports/2012/tr597.pdf http://cran.r-project.org/web/packages/mclust/index.html
Sin embargo, una advertencia: el modelado de mezclas en un espacio de alta dimensión puede hacer que la CPU y la memoria sean bastante intensas si su nube de puntos es grande. Hace aproximadamente cuatro años, estaba haciendo un lote de datos de 11-200 puntos, 50-200K puntos, y tendía a correr a 4-11GB de RAM y me tomaba hasta una semana calcular para cada caso (y tenía 400). Esto es ciertamente posible, pero puede ser un dolor de cabeza si está utilizando un clúster de cómputo compartido o tiene recursos limitados disponibles.
fuente
Esto suena como un clásico modelo de mezcla gaussiana multivariante. Creo que el paquete BayesM podría funcionar.
Aquí hay algunos paquetes de mezcla gaussiana multivariante
fuente