¿Cuál es la diferencia entre los puntajes Z y los valores p?

11

En los algoritmos de motivos de red, parece bastante común devolver un valor p y una puntuación Z para una estadística: "La red de entrada contiene X copias del subgrafo G". Una subgrafía se considera un motivo si satisface

  • valor p <A,
  • Z-score> B y
  • X> C, para algunos A, B y C. definidos por el usuario (o definidos por la comunidad)

Esto motiva la pregunta:

Pregunta : ¿Cuáles son las diferencias entre el valor p y el puntaje Z?

Y la pregunta secundaria:

Pregunta : ¿Existen situaciones en las que el valor p y el puntaje Z de la misma estadística podrían sugerir hipótesis opuestas? ¿Las condiciones primera y segunda enumeradas anteriormente son esencialmente las mismas?

Douglas S. Stones
fuente

Respuestas:

9

Diría, según su pregunta, que no hay diferencia entre las tres pruebas. Esto es en el sentido de que siempre puede elegir A, B y C de tal manera que se llegue a la misma decisión, independientemente del criterio que esté utilizando. Aunque necesita que el valor p se base en la misma estadística (es decir, la puntuación Z)

Para usar el puntaje Z, se supone que tanto la media como la varianza son conocidas, y la distribución se supone normal (o asintóticamente / aproximadamente normal). Supongamos que el criterio del valor p es el 5% habitual. Entonces nosotros tenemos:σ 2μσ2

p=Pr(Z>z)<0.05Z>1.645Xμσ>1.645X>μ+1.645σ

Entonces tenemos el triple que representan los mismos puntos de corte.(0.05,1.645,μ+1.645σ)

Tenga en cuenta que la misma correspondencia se aplicará a la prueba t, aunque los números serán diferentes. La prueba de dos colas también tendrá una correspondencia similar, pero con números diferentes.

probabilidadislogica
fuente
¡Gracias por eso! (y gracias a los otros respondedores también).
Douglas S. Stones
8

Una puntuación describe su desviación de la media en unidades de desviación estándar. No es explícito si acepta o rechaza su hipótesis nula.Z

Un valor es la probabilidad de que, bajo la hipótesis nula, podamos observar un punto que es tan extremo como su estadística. Esto le dice explícitamente si rechaza o acepta su hipótesis nula dado un tamaño de prueba .αpα

XN(μ,1)μ=0x1=5Zσpα=0.05p<αAB

Gary
fuente
3
2σ3σ
Zp
H0:μ=0HA:μ=1H05×107μ=1. Pero esto es absurdo, nadie haría esto, pero la regla del valor p que usa aquí hace esto. Dicho de otra manera, la regla p-valor que usted describe no es invariante con respecto a lo que se llama la "hipótesis nula" (resolución viene)
probabilityislogic
Himp:μ=5HA1×109H0
probabilidadislogica
1
H1:μ0H1P(X|μ1)
6

pz

pzzp

Sheldon Cooper
fuente
Si el tamaño de la muestra es grande, la desviación estándar será pequeña, por lo tanto, la puntuación Z será alta. Creo que puede descubrir esto si intenta un ejemplo numérico.
probabilidadislogica
1
Realmente no. Suponga que toma muestras de N (0, 1). Entonces su estándar será aproximadamente 1 independientemente del tamaño de la muestra. Lo que se hará más pequeño es el error estándar de la media, no la desviación estándar. Los valores p se basan en SEM, no en estándar.
SheldonCooper
La puntuación Z es (media observada) / (desviación estándar). Pero la media y la desviación estándar son de la estadística observada, no de la población de la que se extrajeron sus componentes. Mi floja terminología ha quedado atrapada aquí. Sin embargo, si está probando la media, entonces la desviación estándar apropiada en la puntuación Z es el error estándar, que se hace más pequeño a la misma velocidad que el valor p.
chanceislogic