Uso de la prueba de significación estadística para validar los resultados del análisis de conglomerados

13

Estoy estudiando el uso de las pruebas de significación estadística (SST) para validar los resultados del análisis de conglomerados. He encontrado varios artículos sobre este tema, como

  • " Importancia estadística de la agrupación para datos de alta dimensión y bajo tamaño de muestra " por Liu, Yufeng et al. (2008)
  • " En algunas pruebas de significación en el análisis de conglomerados ", por Bock (1985)

Pero estoy interesado en encontrar algo de literatura argumentando que SST es NO apropiado para validar los resultados del análisis de conglomerados. La única fuente que he encontrado afirmando esto es una página web de un proveedor de software

Para aclarar:

Estoy interesado en probar si se ha encontrado una estructura de conglomerados significativa como resultado del análisis de conglomerados, por lo tanto, me gustaría saber si hay documentos que respalden o rechacen la preocupación "sobre la posibilidad de pruebas post-hoc de los resultados de los datos exploratorios". análisis utilizado para encontrar grupos ".

Acabo de encontrar un artículo de 2003, " Métodos de agrupamiento y clasificación " de Milligan y Hirtle que dice, por ejemplo, que usar ANOVA sería un análisis no válido ya que los datos no tienen asignaciones aleatorias a los grupos.

DPS
fuente
Esta es una buena pregunta, pero puede valer la pena señalar que está redactada de manera que parezca que hay una dicotomía: puede probar la importancia de la agrupación o no. Sin embargo, la situación es diferente porque el "análisis de conglomerados" significa varias cosas. En los documentos a los que se hace referencia, la atención se centra en probar si existe evidencia de agrupamiento. En el manual del software, se expresa con razón la preocupación por la posibilidad de realizar pruebas post hoc de los resultados del análisis exploratorio de datos utilizado para encontrar grupos. No hay contradicción aquí.
whuber
Gracias por responder. Tienes razón sobre la forma en que planteé la pregunta. Estoy interesado en probar si se ha encontrado una estructura de conglomerados significativa como resultado del análisis de conglomerados, por lo tanto, me gustaría saber si hay documentos que respalden o rechacen la preocupación "sobre la posibilidad de pruebas post-hoc de los resultados de los datos exploratorios". análisis utilizado para encontrar grupos ". Acabo de encontrar un artículo de 2003 "Métodos de agrupamiento y clasificación" de Milligan y Hirtle que dice, por ejemplo, que usar ANOVA sería un análisis no válido ya que los datos no tienen asignaciones aleatorias a los grupos.
DPS
Podría ayudar: Cegado por la ciencia: las consecuencias administrativas de soluciones de análisis de clúster inadecuadamente validadas, mrs.org.uk/ijmr_article/article/78841
rolando2

Respuestas:

3

Es bastante obvio que no puede probar (ingenuamente) la diferencia en las distribuciones para grupos que se definieron utilizando los mismos datos. Esto se conoce como "prueba selectiva", "doble inmersión", "inferencia circular", etc.

Un ejemplo sería realizar una prueba t en las alturas de las personas "altas" y "bajas" en sus datos. El nulo será (casi) siempre rechazado.

Dicho esto, uno puede explicar la etapa de agrupamiento en la etapa de prueba. Sin embargo, no estoy familiarizado con una referencia particular que lo haga, pero sospecho que esto debería haberse hecho.

JohnRos
fuente
Estoy de acuerdo en que el nulo casi siempre será rechazado cuando se aplica una prueba de significación en los diferentes grupos de clústeres. Sin embargo, ¿este debería ser el caso si la agrupación realmente logró separar bien los grupos para todas las variables consideradas en la AC? ¿No podría uno usar una prueba de significación para determinar si hay variables que no están bien separadas entre los grupos (es decir, aplicar una prueba para cada variable)? ¿Podría por favor explicar la razón estadística por la cual esto no es recomendable / sensato?
luke
El argumento formal es que el término de error de cada medición no se centra en cero. Piense en mi ejemplo alto / corto: todas las personas provienen de la misma distribución, pero el grupo "alto" tiene errores con la media positiva y la media negativa "baja".
JohnRos
0

En lugar de la prueba de hipótesis con una prueba dada, recomendaría medios de arranque u otras estimaciones resumidas entre grupos. Por ejemplo, podría confiar en el bootstrap percentil con al menos 1000 muestras. El punto clave es aplicar la agrupación de forma independiente a cada muestra de bootstrap.

Este enfoque sería bastante robusto, proporcionaría evidencia de diferencias y respaldaría su afirmación de una diferencia significativa entre grupos. Además, podría generar otra variable (por ejemplo, diferencia entre grupos) y las estimaciones de arranque de dicha variable de diferencia serían similares a una prueba formal de hipótesis.

Joe_74
fuente