¿Por qué controlar FDR es menos estricto que controlar FWER?

16

He leído que controlar FDR es menos estricto que controlar FWER, como en Wikipedia :

Los procedimientos de control de FDR ejercen un control menos estricto sobre el descubrimiento falso en comparación con los procedimientos de tasa de error familiar (FWER) (como la corrección de Bonferroni). Esto aumenta la potencia a costa de aumentar la tasa de errores de tipo I, es decir, rechazar la hipótesis nula de ningún efecto cuando debería aceptarse.

Pero me preguntaba cómo se demuestra que es matemáticamente cierto.

¿Hay alguna relación entre FDR y FWER?

StackExchange para todos
fuente
44
¿Leíste el periódico original? Es casi todo lo que uno podría esperar en un documento de estadísticas: una sola idea fundamental, una historia clara y concisa para contar, un ejemplo útil y (¡breve!) Pruebas precisas.
cardenal

Respuestas:

10

De hecho, @cardinal tiene toda la razón en que el documento es tan claro como parece. Entonces, para lo que vale, en caso de que no tenga acceso al documento, aquí hay una versión ligeramente elaborada de cómo argumenta Benjamini-Hochberg:

El FDR es el valor esperado de la proporción de falsos rechazos v a todos los rechazos r . Ahora, r es, obviamente, la suma de los rechazos falsos y correctos; llamar a este último s .Qevrrs

En resumen, (usando letras mayúsculas para variables aleatorias y letras minúsculas para valores realizados),

Qe=E(VR)=E(VV+S)=:E(Q).

Uno toma si R = 0 .Q=0R=0

Ahora, hay dos posibilidades: o bien todos los valores nulos son verdaderas o simplemente m 0 < m de ellos son verdaderas. En el primer caso, no puede haber rechazos correctos, entonces r = v . Por lo tanto, si hay rechazos ( r 1 ), q = 1 , de lo contrario . Por lo tanto,mm0<mr=vr1q=1q=0

FDR=E(Q)=1P(Q=1)+0P(Q=0)=P(Q=1)=P(V1)=FWER

Entonces, en este caso, de modo que cualquier procedimiento que controle el trivialmente también controla el y viceversa.F D R F W E RFDR=FWERFDRFWER

En el segundo caso en el que , si (por lo tanto, si hay al menos un falso rechazo), obviamente tenemos (esto es una fracción con también en el denominador) que . Esto implica que la función indicadora que toma el valor 1 si hay al menos un falso rechazo, nunca será menor que , . Ahora, espere a ambos lados de la desigualdad, que por la monotonicidad de deja la desigualdad intacta,v > 0 v v / r 1 1 V 1 Q 1 V 1Q Em0<mv>0vv/r11V1Q1V1QE

E(1V1)E(Q)=FDR

El valor esperado de una función de indicador es la probabilidad del evento en el indicador, tenemos , que nuevamente es .F W E RE(1V1)=P(V1)FWER

Por lo tanto, cuando tenemos un procedimiento que controla el en el sentido de que , debemos tener ese .FWERFWERαFDRα

Por el contrario, tener un control en algún puede venir con un sustancialmente mayor . Intuitivamente, aceptar una fracción esperada distinta de cero de falsos rechazos ( ) de un total potencialmente grande de hipótesis probadas puede implicar una probabilidad muy alta de al menos un falso rechazo ( ).FDRαFWERFDRFWER

Por lo tanto, un procedimiento tiene que ser menos estricto cuando solo se desea el control , que también es bueno para el poder. Esta es la misma idea que en cualquier prueba de hipótesis básica: cuando prueba al nivel del 5%, rechaza con mayor frecuencia (tanto nulos correctos como falsos) que cuando prueba al nivel del 1% simplemente porque tiene un valor crítico menor.FDR

Christoph Hanck
fuente
2
(+1) Buena exposición. Obviamente, en el primer caso también podemos decir que el control FWER implica control FDR (que es el asunto en cuestión). Además, puede valer la pena señalar que esta propiedad viene sin supuestos de distribución (por ejemplo, independencia) en las estadísticas de prueba, a diferencia del procedimiento dado en el documento original para el control del FDR.
cardenal