Por técnicas de regularización me refiero a lazo, regresión de cresta, red elástica y similares.
Considere un modelo predictivo sobre datos de atención médica que contenga datos demográficos y de diagnóstico en los que se pronostique la duración de la estadía para hospitalización. Para algunos individuos hay múltiples observaciones LOS (es decir, más de un episodio de IP) durante el período de tiempo de referencia que están correlacionadas.
¿Tiene sentido construir, por ejemplo, un modelo predictivo neto elástico que contenga un término de intercepción de efecto aleatorio para cada individuo?
Respuestas:
Hay algunos documentos que abordan esta pregunta. Buscaría sin ningún orden especial:
Pen.LME: Howard D Bondell, Arun Krishna y Sujit K Ghosh. Selección de variables conjuntas para efectos fijos y aleatorios en modelos lineales de efectos mixtos. Biometrics, 66 (4): 1069-1077, 2010.
GLMMLASSO: Jurg Schelldorfer, Peter Buhlmann, Sara van de Geer. Estimación para modelos lineales de efectos mixtos de alta dimensión utilizando la penalización L1. Scandinavian Journal of Statistics, 38 (2): 197-214, 2011.
que se puede encontrar en línea.
Ahora estoy terminando un artículo sobre la aplicación de una penalización neta elástica al modelo mixto (LMMEN) y planeo enviarlo para su revisión en el próximo mes.
Sobre todo, si está modelando datos que no son normales o no tienen un enlace de identidad, usaría GLMMLASSO (pero tenga en cuenta que no puede manejar muchos RE). De lo contrario, Pen.LME es bueno dado que no tiene datos altamente correlacionados, ya sea en los efectos fijos o aleatorios. En este último caso, puede enviarme un correo electrónico y con gusto le enviaré un código / papel (lo pondré en cran en un futuro próximo).
Subí a CRAN hoy - lmmen . Resuelve el problema del modelo lineal mixto con una penalización de tipo de red elástica sobre los efectos fijos y aleatorios simultáneamente.
También hay en el paquete funciones cv para los paquetes lmmlasso y glmmLasso .
fuente
Siempre vi la regresión de crestas como modelos empíricos de efectos aleatorios no limitados a una sola variable categórica (y sin matrices de correlación sofisticadas). Casi siempre puede obtener las mismas predicciones al validar de forma cruzada una penalización de cresta y ajustar / estimar un efecto aleatorio simple. En su ejemplo, podría ponerse elegante y tener una penalización de cresta separada en las funciones de demostración / diagnóstico y otra en los indicadores del paciente (usando algo en la línea del factor de escala de penalización
glmnet
). Alternativamente, podría incluir un elegante efecto aleatorio que tenga efectos correlacionados por el tiempo por persona. Ninguna de estas posibilidades es correcta o incorrecta, solo son útiles.fuente
Actualmente estoy pensando en una pregunta similar. Creo que en la aplicación, puedes hacerlo si funciona y crees que usarlo es razonable. Si se trata de una configuración habitual en los efectos aleatorios (eso significa que tiene mediciones repetidas para cada grupo), entonces se trata solo de la técnica de estimación, que es menos controvertida. Si en realidad no tiene muchas mediciones repetidas para la mayoría de los grupos, entonces podría estar en el límite del modelo habitual de efectos aleatorios y es posible que desee justificar cuidadosamente su validez (desde una perspectiva metodológica) si desea proponerlo como un general método.
fuente