Contexto
Quiero establecer la escena antes de ampliar un poco la cuestión.
Tengo datos longitudinales, mediciones tomadas en sujetos aproximadamente cada 3 meses, el resultado primario es numérico (como en continuo a 1dp) en el rango de 5 a 14 con el grueso (de todos los puntos de datos) entre 7 y 10. Si hago un El gráfico de espagueti (con la edad en el eje xy una línea para cada persona) obviamente es un desastre, ya que tengo> 1500 sujetos, pero hay una clara huella hacia valores más altos con el aumento de la edad (y esto se sabe).
La pregunta más amplia: lo que nos gustaría hacer es primero poder identificar grupos de tendencias (aquellos que comienzan alto y permanecen altos, aquellos que comienzan bajo y permanecen bajos, aquellos que comienzan bajos y aumentan a altos, etc.) y luego podemos mire los factores individuales que están asociados con la membresía del 'grupo de tendencia'.
Mi pregunta aquí se refiere específicamente a la primera parte, la agrupación por tendencia.
Pregunta
- ¿Cómo podemos agrupar trayectorias longitudinales individuales?
- ¿Qué software sería adecuado para implementar esto?
He visto Proc Traj en SAS y M-Plus sugerido por un colega, que estoy investigando, pero me gustaría saber qué piensan los demás sobre esto.
fuente
kml
paquete : parece proporcionar la funcionalidad que necesita. El artículo en JoSS lo describe en detalle. Tambiénkml3d
ykmlShape
podría ser de interés.Respuestas:
He usado el Mfuzz en R para agrupar conjuntos de datos de microarrays de curso de tiempo. Mfuzz usa "agrupación suave". Básicamente, los individuos pueden aparecer en más de un grupo.
Como @Andy señala en el comentario, el documento original utiliza datos de CTN. Sin embargo, sospecho que debería funcionar bien para sus datos discretos. Especialmente porque solo estás explorando el conjunto de datos. Aquí hay un ejemplo rápido en R:
Da la siguiente trama:
fuente
Espero que haya un paquete MPLUS para hacer lo que necesita. Hay un artículo en Psychometrika sobre casi exactamente este tema.
springerlink.com/content/25r110007g417187
excepto que los datos son binarios y las trayectorias son trayectorias de probabilidad. Los autores utilizan el análisis de clase latente (implementado mediante el uso de un modelo de mezcla finita penalizado) para agrupar trayectorias. También sé que el primer autor escribió algunos otros documentos hace unos 10 años con Bengt Muthen (creador de MPLUS) sobre el análisis de clase latente en entornos similares (con trayectorias). Por ejemplo,
http://onlinelibrary.wiley.com/doi/10.1111/j.0006-341X.1999.00463.x/abstract
suena muy similar a lo que estás hablando, excepto que el resultado es binario. El caso continuo es mucho más simple, por lo que haría una búsqueda bibliográfica hacia atrás (es decir, mira los documentos a los que hacen referencia estos documentos) para encontrar algo que coincida con lo que ha descrito con mayor precisión.
Para obtener más información, puede preguntar directamente a los propietarios de MPLUS qué paquete necesita usar para hacer lo que necesita. En general, responden bastante rápido y son muy útiles:
http://www.statmodel.com/cgi-bin/discus/discus.cgi
fuente