valor de p como una distancia?

8

¿Se pueden considerar los valores de p entre múltiples pruebas en pares como una medida de similitud / distancia y aplicar una escala multidimensional sobre una matriz de valores de p en pares para reducir la dimensionalidad? Esta es una pregunta suave, pero ¿cuál sería el mayor problema aquí y cómo podría superarse mejor? (ej: desigualdad triangular?)

qlinck
fuente
2
Mi respuesta breve a su primera pregunta sobre "distancia de similitud" sería No, puede consultar una pregunta similar sobre un asunto diferente aquí: stats.stackexchange.com/questions/32890/… . Entonces, estas publicaciones sugerirían otras medidas de "divergencia" o distancia. Supongo que es mejor abordar primero tu primera pregunta.
JDav

Respuestas:

3

Si todas las "distancias verdaderas" son 0, entonces los valores p seguirán una distribución uniforme y serían solo distancias aleatorias e incorrectas.
Si las distancias reales no son 0, entonces todavía tiene problemas de escala en los que una estadística de prueba puede ser más significativa. Los valores P de 0.9 y 0.6 no son muy diferentes en interpretación, mientras que los valores p de 0.06 y 0.01 son bastante diferentes en interpretación, pero los algoritmos mds pondrían más distancia entre los primeros que los posteriores. También debe considerar la potencia, puede tener 2 grupos que tienen una distancia muy pequeña entre ellos, pero tamaños de muestra grandes para obtener un valor p pequeño; luego otro par con una gran diferencia entre ellos, pero debido al pequeño tamaño de la muestra (baja potencia) se obtiene un valor p mayor.

Greg Snow
fuente
2

Creo que la respuesta es si.

Uno podría pensar en la "similitud" entre dos variables que se medirán por (digamos) correlación. Y para que el valor p sea la importancia de que la correlación sea diferente de 0. En tal caso, un valor p pequeño (cercano a cero) es uno que refleja una gran distancia ("diferencia") entre las variables.

Podría convertir los valores p en puntajes z (donde la "distancia" de ellos tendrá que ir a la dirección "habitual"), y ver si los métodos que mencionó tendrán sentido en eso ...

Tal Galili
fuente
1

No estoy seguro de lo que quiere decir con "valores p entre múltiples pruebas por pares". El valor p es una medida de cuán probable / improbable para una prueba en particular sería ver un valor como extremo o más extremo de lo que realmente se observó si la hipótesis nula es cierta. Cuando se realizan pruebas por pares, no hay una conexión particular entre un valor p y otro. No veo cómo podría considerarse cualquier valor de p como una medida de similitud entre las pruebas por pares.

Michael R. Chernick
fuente