¿Se pueden considerar los valores de p entre múltiples pruebas en pares como una medida de similitud / distancia y aplicar una escala multidimensional sobre una matriz de valores de p en pares para reducir la dimensionalidad? Esta es una pregunta suave, pero ¿cuál sería el mayor problema aquí y cómo podría superarse mejor? (ej: desigualdad triangular?)
8
Respuestas:
Un caso específico, donde los valores p se generan a partir de pruebas sobre tablas de frecuencia se utilizaron como similitudes y se aplicó el escalado multidimensional en este documento: http://www.biomedcentral.com/content/pdf/1748-7188 -1-10.pdfχ2
fuente
Si todas las "distancias verdaderas" son 0, entonces los valores p seguirán una distribución uniforme y serían solo distancias aleatorias e incorrectas.
Si las distancias reales no son 0, entonces todavía tiene problemas de escala en los que una estadística de prueba puede ser más significativa. Los valores P de 0.9 y 0.6 no son muy diferentes en interpretación, mientras que los valores p de 0.06 y 0.01 son bastante diferentes en interpretación, pero los algoritmos mds pondrían más distancia entre los primeros que los posteriores. También debe considerar la potencia, puede tener 2 grupos que tienen una distancia muy pequeña entre ellos, pero tamaños de muestra grandes para obtener un valor p pequeño; luego otro par con una gran diferencia entre ellos, pero debido al pequeño tamaño de la muestra (baja potencia) se obtiene un valor p mayor.
fuente
Creo que la respuesta es si.
Uno podría pensar en la "similitud" entre dos variables que se medirán por (digamos) correlación. Y para que el valor p sea la importancia de que la correlación sea diferente de 0. En tal caso, un valor p pequeño (cercano a cero) es uno que refleja una gran distancia ("diferencia") entre las variables.
Podría convertir los valores p en puntajes z (donde la "distancia" de ellos tendrá que ir a la dirección "habitual"), y ver si los métodos que mencionó tendrán sentido en eso ...
fuente
No estoy seguro de lo que quiere decir con "valores p entre múltiples pruebas por pares". El valor p es una medida de cuán probable / improbable para una prueba en particular sería ver un valor como extremo o más extremo de lo que realmente se observó si la hipótesis nula es cierta. Cuando se realizan pruebas por pares, no hay una conexión particular entre un valor p y otro. No veo cómo podría considerarse cualquier valor de p como una medida de similitud entre las pruebas por pares.
fuente