Análisis de agrupamiento seguido de análisis discriminante

10

¿Cuál es la razón, si la hay, para usar el Análisis discriminante (DA) en los resultados de un algoritmo de agrupamiento como k-means, como lo veo de vez en cuando en la literatura (esencialmente sobre el subtipo clínico de los trastornos mentales)?

Por lo general, no se recomienda probar las diferencias de grupo en las variables que se usaron durante la construcción del conglomerado, ya que apoyan la maximización (minimización de la respiración) de la inercia entre clases (resp. Dentro de la clase). Por lo tanto, no estoy seguro de apreciar completamente el valor agregado del DA predictivo, a menos que intentemos integrar a los individuos en un espacio factorial de menor dimensión y tener una idea de la "generalización" de tal partición. Pero incluso en este caso, el análisis de conglomerados sigue siendo fundamentalmente una herramienta exploratoria, por lo que el uso de la membresía de clase calculada de esta manera para derivar aún más una regla de puntuación parece extraño a primera vista.

¿Alguna recomendación, idea o sugerencia para documentos relevantes?

chl
fuente
Aquí hay una explicación y un ejemplo usando R: cran.r-project.org/web/packages/adegenet/vignettes/…
Ben

Respuestas:

5

No conozco ningún documento sobre esto. He usado este enfoque, con fines descriptivos. DFA proporciona una buena manera de resumir las diferencias de grupo y la dimensionalidad con respecto a las variables originales. Uno podría fácilmente perfilar los grupos en las variables originales, sin embargo, esto pierde la naturaleza inherentemente multivariada del problema de agrupamiento. DFA le permite describir los grupos mientras mantiene intacto el carácter multivariado del problema. Por lo tanto, puede ayudar con la interpretación de los grupos, donde ese es un objetivo. Esto es particularmente ideal cuando existe una estrecha relación entre su método de agrupación y su método de clasificación, por ejemplo, DFA y el método de Ward.

Tienes razón sobre el problema de la prueba. Publiqué un artículo usando el análisis de clúster con seguimiento de DFA para describir la solución de agrupamiento. Presenté los resultados de DFA sin estadísticas de prueba. Un revisor tuvo problemas con eso. Admití y puse las estadísticas de prueba y los valores p allí, con el descargo de responsabilidad de que estos valores p no deberían interpretarse de la manera tradicional.

Brett
fuente
¿Cuáles serían los pasos de procedimiento de DA después de la agrupación? ¿Puedes pensar en otras técnicas para descubrir qué variables originales hacen que cierto grupo sea diferente de otros?
danas.zuokas
¿Te gustaría compartir la cita de ese periódico, Brett?
Roman Luštrik
Weissman y Magill. 2008. "Desarrollo de una tipología estudiantil para examinar la efectividad de los seminarios de primer año" Revista de la experiencia de primer año y estudiantes en transición 20 (2). Contáctame sin conexión si quieres una copia impresa.
Brett