¿Cuáles son las principales diferencias entre los análisis taxométricos (p. Ej., MAXCOV, MAXEIG) y los análisis de clase latente?

8

Investigaciones recientes han intentado determinar si ciertas construcciones psicológicas son latentemente dimensionales o taxónicas (es decir, incluyendo taxones o clases). Por ejemplo, los investigadores pueden estar interesados ​​en averiguar si hay una cierta "clase" de personas que tienen más probabilidades de desarrollar dolor crónico después de una lesión, o si el riesgo de desarrollar dolor crónico se conceptualiza mejor como un rango dimensional de riesgo limitado a Riesgo extremadamente alto. Me di cuenta de que los investigadores intentan responder a este tipo de preguntas utilizando dos tipos de análisis: análisis taxométricos (MAMBAC, MAXEIG, MAXCOV) típicamente realizados en R y análisis de clase latente.

Estos son algunos ejemplos de estudios taxométricos:

Estos son algunos ejemplos que utilizan análisis de clase latente:

Aquí están mis preguntas:

  1. En inglés, ¿cuáles son las principales diferencias entre estos dos tipos de análisis? Si es posible, explique si responden preguntas diferentes y cómo son analíticamente (matemáticamente) diferentes.

  2. ¿Cuál es mejor para responder el tipo de pregunta que destaqué en mi "introducción" y por qué? Quizás esto sea realmente incontestable en este momento.

Además, comparta cualquier información que considere relevante para este tema. ¡Tengo la sensación de que tendré preguntas de seguimiento!

Behacad
fuente

Respuestas:

7

Ver Tueller (2010) , Tueller y Lubke (2010) y [Ruscio et al.'l book] [3] para obtener detalles completos sobre lo que se resume a continuación. Los procedimientos taxométricos generalmente funcionan calculando estadísticas simples sobre un subconjunto de datos ordenados. MAMBAC usa la media, MAXCOV usa la covarianza y MAXEIG usa el valor propio. El análisis de clase latente es un caso especial del modelo de mezcla variable latente general (LVMM). El LVMM especifica un modelo para los datos que puede incluir clases latentes, factores latentes o ambos. Los parámetros del modelo se obtienen utilizando la máxima verosimilitud o las estimaciones bayesianas. Consulte la literatura anterior para obtener detalles completos.

Lo que es más importante que los fundamentos matemáticos (que están más allá del alcance de este foro) son las hipótesis que se pueden probar con cada enfoque. Los procedimientos taxométricos prueban la hipótesis

H1: Dos clases explican toda (o la mayoría) de la correlación observada entre un conjunto de indicadores H0: Una (o más) dimensión (es) subyacente (s) continua (s) explican toda la correlación observada entre un conjunto de indicadores

Por lo general, el CCFI se utiliza para determinar qué hipótesis rechazar / retener. Ver [el libro de John Ruscio sobre el tema] [4]. Los procedimientos taxométricos solo pueden probar estas dos hipótesis y ninguna otra.

Utilizado solo, el análisis de clase latente no puede probar la hipótesis alternativa taxométrica, H0 anterior. Sin embargo, el análisis de clase latente puede probar las siguientes hipótesis alternativas:

H1a: Dos clases explican toda la correlación observada entre un conjunto de indicadores H1b: Tres clases explican toda la correlación observada entre un conjunto de indicadores ... H1k: las clases k explican toda la correlación observada entre un conjunto de indicadores

Para probar H0 desde arriba en un marco variable latente, ajuste un modelo de análisis factorial confirmatorio (CFA) a los datos (llame a este H0cfa que es diferente de H0 - H0 solo prueba una hipótesis de ajuste bajo el marco taxométrico, pero no t producir estimaciones de parámetros como se obtendría al ajustar un modelo CFA). Para comparar H0cfa con H1a, H1b, ..., H1k, utilice el Criterio de información bayesiano (BIC) ala [Nylund et al. (2007)] [5].

Para resumir hasta ahora, los procedimientos taxométricos pueden considerar soluciones de dos o una clase, mientras que la clase latente + CFA puede probar soluciones de una o dos o más clases. Vemos que los procedimientos taxométricos prueban un subconjunto de las hipótesis probadas por comparaciones de modelos de clase latente + CFA.

Todas las hipótesis presentes hasta el momento son extremos en dos extremos de un espectro. La hipótesis más general es que cierto número de clases latentes y cierto número de dimensiones latentes (o factores latentes) explican mejor los datos. Los enfoques descritos anteriormente rechazan esto directamente, lo cual es una suposición muy fuerte. Dicho de otra manera, un modelo de clase latente y un procedimiento taxométrico que conducen a una conclusión de la estructura taxónica (en lugar de dimensional) suponen diferencias individuales dentro de la clase además del error aleatorio. En su contexto, esto equivale a decir que dentro de la clase de dolor crónico, no existe una variación sistemática en la tendencia a desarrollar dolor crónico, solo una posibilidad aleatoria.

La debilidad de esta suposición se ilustra mejor con un ejemplo de la psicopatología. Supongamos que tiene un conjunto de indicadores para la depresión, y sus modelos de clase taxométrica y / o latente lo llevan a concluir que hay una clase deprimida y una clase no deprimida. Estos modelos suponen implícitamente que no hay variación en la gravedad de la depresión dentro de la clase (más allá del error aleatorio o el ruido). En otras palabras, usted está deprimido o no, y entre los deprimidos todos están igualmente deprimidos (más allá de la variación en las variables observadas propensas a errores). ¡Entonces solo necesitamos un tratamiento para la depresión con un nivel de dosis! Es fácil ver que esta suposición es absurda para la depresión, y a menudo es tan limitada para la mayoría de los otros contextos de investigación.

Para evitar hacer esta suposición, utilice un enfoque de modelado de mezcla de factores siguiendo los documentos de [Lubke y Muthen y Lubke y Neale] [6].

Stueller
fuente
(+1) ¡Bienvenido a nuestro sitio y gracias por contribuir con una respuesta tan bien desarrollada!
whuber
¡Guauu! Casi siento que te registraste solo para responder esta pregunta. Gracias, muy esclarecedor. ¿Podrías quizás dar más detalles sobre las formas de evitar las limitaciones que resaltaste? ¿Asumo que tiene que ver con una invariancia débil (y similar)? El programa que uso tiene la capacidad de hacer que las variaciones de error sean independientes, las covarianzas de error sean independientes y los efectos de factor sean independientes. Tengo la sensación de que esta es quizás la dirección correcta, pero debido a la terminología diferente, es difícil estar seguro.
Behacad