Contexto :
Imagine que tiene un estudio longitudinal que mide una variable dependiente (DV) una vez por semana durante 20 semanas en 200 participantes. Aunque estoy interesado en general, los DV típicos en los que estoy pensando incluyen el desempeño laboral después de la contratación o varias medidas de bienestar después de una intervención de psicología clínica.
Sé que el modelado multinivel se puede usar para modelar la relación entre el tiempo y el DV. También puede permitir que los coeficientes (por ejemplo, intersecciones, pendientes, etc.) varíen entre individuos y estimen los valores particulares para los participantes. Pero, ¿qué pasa si al inspeccionar visualmente los datos encuentra que la relación entre el tiempo y el DV es cualquiera de los siguientes:
- diferente en forma funcional (quizás algunos son lineales y otros son exponenciales o algunos tienen una discontinuidad)
- diferente en la varianza de error (algunas personas son más volátiles de un punto de tiempo al siguiente)
Preguntas :
- ¿Cuál sería una buena manera de abordar datos de modelado como este?
- Específicamente, ¿qué enfoques son buenos para identificar diferentes tipos de relaciones y clasificar a las personas con respecto a su tipo?
- ¿Qué implementaciones existen en R para tales análisis?
- ¿Hay alguna referencia sobre cómo hacer esto: libro de texto o aplicación real?
fuente
Recomiendo echar un vistazo a un par de artículos de Heping Zhang usando splines adaptativas para modelar datos longitudinales:
Además, consulte la página MASAL para ver el software que incluye un paquete R.
fuente
Me parece que los Modelos de mezcla de crecimiento podrían tener el potencial de permitirle examinar su varianza de error. ( PDF aquí). (No estoy seguro de qué son los modelos heterocedásticos elásticos, pero definitivamente tendré que verificarlos).
Los modelos de trayectoria basados en grupos latentes se han vuelto muy populares últimamente en criminología. Pero muchas personas simplemente dan por sentado que los grupos realmente existen, y algunas investigaciones astutas han señalado que encontrará grupos incluso en datos aleatorios. Además, tener en cuenta que el enfoque de modelado basado en grupos de Nagin no le permite evaluar su error (y, sinceramente, nunca he visto un modelo que se parezca a una discontinuidad).
Aunque sería difícil con 20 puntos de tiempo, para fines exploratorios, crear heurísticas simples para identificar patrones podría ser útil (por ejemplo, siempre bajo o siempre alto, coeficiente de variación). Estoy imaginando minigráficos en una hoja de cálculo o gráficas de coordenadas paralelas, pero dudo que sean útiles (sinceramente, nunca he visto una gráfica de coordenadas paralelas que sea muy esclarecedora).
Buena suerte
fuente
Cuatro años después de hacer esta pregunta, he aprendido algunas cosas, así que tal vez debería agregar algunas ideas.
Creo que el modelado jerárquico bayesiano proporciona un enfoque flexible para este problema.
Software : herramientas como jags, stan, WinBugs, etc., potencialmente combinadas con sus respectivos paquetes de interfaz R (por ejemplo, rjags, rstan) facilitan la especificación de dichos modelos.
Variar el error dentro de la persona: los modelos bayesianos facilitan la especificación de la varianza del error dentro de la persona como un factor aleatorio que varía entre las personas.
Por ejemplo, podría modelar los puntajes en los participantes en los puntos de tiempo comoy i=1,...,n j=1,...J
Por lo tanto, la desviación estándar de cada persona podría modelarse como una distribución gamma. He encontrado que este es un parámetro importante en muchos dominios psicológicos donde las personas varían en la medida en que varían con el tiempo.
Clases de curvas latentes: todavía no he explorado esta idea, pero es relativamente sencillo especificar dos o más funciones de generación de datos posibles para cada individuo y luego dejar que el modelo bayesiano elija el modelo más probable para un individuo determinado. Por lo tanto, normalmente obtendría probabilidades posteriores para cada individuo con respecto a qué forma funcional describe los datos de los individuos.
Como bosquejo de una idea para un modelo, podría tener algo como lo siguiente:
Donde es el tiempo y representa los valores esperados para un modelo exponencial de tres parámetros y representa los valores esperados para un modelo cuadrático. representa la probabilidad de que el modelo elija .xij λ(1)ij λ(2)ij πi λ(1)ij
fuente
John Fox tiene un gran apéndice disponible en línea usando nlme para ver datos longitudinales. Puede ser útil para usted:
http://cran.r-project.org/doc/contrib/Fox-Companion/appendix-mixed-models.pdf
Hay muchas cosas geniales allí (¡y los libros de Fox son generalmente bastante buenos!).
fuente