¿Cuál es la fórmula para el valor p ajustado de Benjamini-Hochberg?

14

Entiendo el procedimiento y lo que controla. Entonces, ¿cuál es la fórmula para el valor p ajustado en el procedimiento BH para comparaciones múltiples?


Justo ahora me di cuenta de que el BH original no producía valores p ajustados, solo ajustaba la condición de (no) rechazo: https://www.jstor.org/stable/2346101 . Gordon Smyth introdujo los valores p de BH ajustados en 2002 de todos modos, por lo que la pregunta aún se aplica. Se implementa en R como p.adjustcon el método BH.

Firebug
fuente

Respuestas:

6

El famoso artículo seminal de Benjamini y Hochberg (1995) describió el procedimiento para aceptar / rechazar hipótesis basadas en el ajuste de los niveles alfa. Este procedimiento tiene una reformulación equivalente directa en términos de valores p ajustados , pero no se discutió en el documento original. Según Gordon Smyth , introdujo los valores p ajustados en 2002 cuando se implementó p.adjusten R. Desafortunadamente, no hay una cita correspondiente, por lo que siempre me ha quedado claro qué se debe citar si se usan valores p ajustados por BH .

Resulta que el procedimiento se describe en Benjamini, Heller, Yekutieli (2009) :

Una forma alternativa de presentar los resultados de este procedimiento es presentar los valores p ajustados . Los valores p ajustados por BH se definen como

p(i)BH=min{minji{mp(j)j},1}.

Esta fórmula parece más complicada de lo que realmente es. Dice:

  1. Primero, ordene todos los valores p de pequeño a grande. Luego, multiplique cada valor de p por el número total de pruebas m divida por su orden de clasificación.
  2. En segundo lugar, asegúrese de que la secuencia resultante no disminuya: si alguna vez comienza a disminuir, haga que el valor p anterior sea igual al subsiguiente (repetidamente, hasta que la secuencia completa no disminuya).
  3. Si algún valor p termina siendo mayor que 1, haga que sea igual a 1.

Esta es una reformulación directa del procedimiento original de BH de 1995. Puede existir un documento anterior que introdujo explícitamente el concepto de valores p ajustados por BH , pero no conozco ninguno.


Actualizar. @Zenit descubrió que Yekutieli y Benjamini (1999) describieron lo mismo ya en 1999:

ingrese la descripción de la imagen aquí

ameba dice reinstalar Monica
fuente
Esa es la respuesta que esperaba, +1. Recuerdo haber leído sobre la implementación de Gordon Smyth del valor p ajustado también y no saber a quién citar, genial ver que hay una cita de "canon" para esto.
Firebug
1
Creo que existe una referencia incluso anterior: Yekutieli y Benjamini (1999) (versión en pdf disponible aquí ). La definición 2.4 describe cómo se puede reformular el procedimiento FDR original de 1995 en términos de valores p ajustados. Gracias a esta publicación de blog donde encontré sobre esto.
Zenit
@ Zenit ¡Vaya! Gran descubrimiento! Debería actualizar mi respuesta.
ameba dice Reinstate Monica
Gracias por la fuente @Zenit! Es un poco extraño cómo un método estadístico tan omnipresente no tiene una referencia bien conocida.
Firebug
8

Primero una respuesta al punto. Considere que es el valor p (prueba única) asociado con el valor z 0 del estadístico de prueba. El FDR Benjamini-Hochberg se calcula en dos pasos ( N 0 = # valores p 0 , N = # valores):p0pz0N0 p0N

  • FDR (p0)=p0N0N

  • FDR (pi)=min(FDR(pi),FDR(pi+1))


Ahora entendamos esto. La idea subyacente (bayesiana) es que las observaciones provienen de una mezcla de dos distribuciones:

  • observaciones de la densidad nula f 0 ( z )π0Nf0(z)
  • (1π0)Nf1(z)

Lo que se observa es la mezcla de esos dos:

  • f(z)=π0f0(z)+(1π0)f1(z)

ingrese la descripción de la imagen aquí

Las definiciones (bayesianas) son:

  • Fdr=π0(1F0(z0))(1F(z))
  • fdr=π0f0(z0)f(z)

π01

ingrese la descripción de la imagen aquí

(Basado en la inferencia estadística de la era de la computadora de Efron y Tibshirani )

Aditya
fuente