Estoy estudiando el uso de las pruebas de significación estadística (SST) para validar los resultados del análisis de conglomerados. He encontrado varios artículos sobre este tema, como
- " Importancia estadística de la agrupación para datos de alta dimensión y bajo tamaño de muestra " por Liu, Yufeng et al. (2008)
- " En algunas pruebas de significación en el análisis de conglomerados ", por Bock (1985)
Pero estoy interesado en encontrar algo de literatura argumentando que SST es NO apropiado para validar los resultados del análisis de conglomerados. La única fuente que he encontrado afirmando esto es una página web de un proveedor de software
Para aclarar:
Estoy interesado en probar si se ha encontrado una estructura de conglomerados significativa como resultado del análisis de conglomerados, por lo tanto, me gustaría saber si hay documentos que respalden o rechacen la preocupación "sobre la posibilidad de pruebas post-hoc de los resultados de los datos exploratorios". análisis utilizado para encontrar grupos ".
Acabo de encontrar un artículo de 2003, " Métodos de agrupamiento y clasificación " de Milligan y Hirtle que dice, por ejemplo, que usar ANOVA sería un análisis no válido ya que los datos no tienen asignaciones aleatorias a los grupos.
Respuestas:
Es bastante obvio que no puede probar (ingenuamente) la diferencia en las distribuciones para grupos que se definieron utilizando los mismos datos. Esto se conoce como "prueba selectiva", "doble inmersión", "inferencia circular", etc.
Un ejemplo sería realizar una prueba t en las alturas de las personas "altas" y "bajas" en sus datos. El nulo será (casi) siempre rechazado.
Dicho esto, uno puede explicar la etapa de agrupamiento en la etapa de prueba. Sin embargo, no estoy familiarizado con una referencia particular que lo haga, pero sospecho que esto debería haberse hecho.
fuente
En lugar de la prueba de hipótesis con una prueba dada, recomendaría medios de arranque u otras estimaciones resumidas entre grupos. Por ejemplo, podría confiar en el bootstrap percentil con al menos 1000 muestras. El punto clave es aplicar la agrupación de forma independiente a cada muestra de bootstrap.
Este enfoque sería bastante robusto, proporcionaría evidencia de diferencias y respaldaría su afirmación de una diferencia significativa entre grupos. Además, podría generar otra variable (por ejemplo, diferencia entre grupos) y las estimaciones de arranque de dicha variable de diferencia serían similares a una prueba formal de hipótesis.
fuente