Con frecuencia leo que la corrección de Bonferroni también funciona para hipótesis dependientes. Sin embargo, no creo que sea cierto y tengo un contraejemplo. ¿Puede alguien decirme (a) dónde está mi error o (b) si estoy en lo correcto?
Configurar el ejemplo de contador
Supongamos que estamos probando dos hipótesis. Sea la primera hipótesis es falsa y contrario. Defina manera similar. Deje que sean los valores p asociados con las dos hipótesis y deje que Denote la función del indicador para el conjunto especificado dentro de los corchetes.H1=0H1=1H2p1,p2[[⋅]]
Para fijo define
que obviamente son densidades de probabilidad sobre . Aquí hay una gráfica de las dos densidades.θ∈[0,1]
P(p1,p2|H1=0,H2=0)P(p1,p2|H1=0,H2=1)===12θ[[0≤p1≤θ]]+12θ[[0≤p2≤θ]]P(p1,p2|H1=1,H2=0)1(1−θ)2[[θ≤p1≤1]]⋅[[θ≤p2≤1]]
[0,1]2
La marginación produce
y de manera similar para .
P(p1|H1=0,H2=0)P(p1|H1=0,H2=1)==12θ[[0≤p1≤θ]]+121(1−θ)[[θ≤p1≤1]]
p2
Además, deje
Esto implica que
P(H2=0|H1=0)P(H2=1|H1=0)==P(H1=0|H2=0)=2θ1+θP(H1=1|H2=0)=1−θ1+θ.
P(p1|H1=0)====∑h2∈{0,1}P(p1|H1=0,h2)P(h2|H1=0)12θ[[0≤p1≤θ]]2θ1+θ+122θ1+θ+1(1−θ)[[θ≤p1≤1]]1−θ1+θ11+θ[[0≤p1≤θ]]+θ1+θ+11+θ[[θ≤p1≤1]]U[0,1]
es uniforme como se requiere para los valores p bajo la hipótesis nula. Lo mismo es cierto para debido a la simetría.
p2
Para obtener la distribución conjunta calculamosP(H1,H2)
P(H2=0|H1=0)P(H1=0)⇔2θ1+θP(H1=0)⇔P(H1=0)===P(H1=0|H2=0)P(H2=0)2θ1+θP(H2=0)P(H2=0):=q
Por lo tanto, la distribución conjunta viene dada por
que significa que .
P(H1,H2)=H1=0H1=1H2=02θ1+θq1−θ1+θqH2=11−θ1+θq1+θ−2q1+θ
0≤q≤1+θ2
Por qué es un contraejemplo
Ahora dejemos para el nivel de significancia
de interés. La probabilidad de obtener al menos un falso positivo con el nivel de significancia corregido dado que ambas hipótesis son falsas (es decir, ) viene dada por
porque todos los valores de y son inferiores a
dado que yθ=α2αα2Hi=0
P((p1≤α2)∨(p2≤α2)|H1=0,H2=0)=1
p1p2α2H1=0H2=0por construcción. La corrección de Bonferroni, sin embargo, afirmaría que el FWER es menor que .
α
Respuestas:
Bonferroni no puede ser liberal, independientemente de la dependencia, si sus valores p se calculan correctamente.
Deje que A sea el evento de error de Tipo I en una prueba y que B sea el evento de error de Tipo I en otra prueba. La probabilidad de que ocurra A o B (o ambos) es:
P (A o B) = P (A) + P (B) - P (A y B)
Debido a que P (A y B) es una probabilidad y, por lo tanto, no puede ser negativa, no hay forma posible de que esa ecuación produzca un valor mayor que P (A) + P (B). El valor más alto que puede producir la ecuación es cuando P (A y B) = 0, es decir, cuando A y B dependen perfectamente negativamente. En ese caso, puede completar la ecuación de la siguiente manera, suponiendo que los valores nulos sean verdaderos y un nivel alfa ajustado por Bonferroni de .025:
P (A o B) = P (A) + P (B) - P (A y B) = .025 + .025 - 0 = .05
Bajo cualquier otra estructura de dependencia, P (A y B)> 0, entonces la ecuación produce un valor aún menor que .05. Por ejemplo, bajo una dependencia positiva perfecta, P (A y B) = P (A), en cuyo caso puede completar la ecuación de la siguiente manera:
P (A o B) = P (A) + P (B) - P (A y B) = .025 + .025 - .025 = .025
Otro ejemplo: bajo independencia, P (A y B) = P (A) P (B). Por lo tanto:
P (A o B) = P (A) + P (B) - P (A y B) = .025 + .025 - .025 * .025 = .0494
Como puede ver, si un evento tiene una probabilidad de .025 y otro evento también tiene una probabilidad de .025, es imposible que la probabilidad de "uno o ambos" eventos sea mayor que .05, porque es imposible para P ( A o B) para ser mayor que P (A) + P (B). Cualquier reclamo en contrario es lógicamente absurdo.
"Pero eso supone que ambos valores nulos son ciertos", podría decir. "¿Qué pasa si el primer nulo es verdadero y el segundo es falso?" En ese caso, B es imposible porque no puede haber un error de Tipo I donde la hipótesis nula es falsa. Por lo tanto, P (B) = 0 y P (A y B) = 0. Así que completemos nuestra fórmula general para el FWER de dos pruebas:
P (A o B) = P (A) + P (B) - P (A y B) = .025 + 0 - 0 = .025
Entonces, una vez más, el FWER es <.05. Tenga en cuenta que la dependencia es irrelevante aquí porque P (A y B) siempre es 0. Otro escenario posible es que ambos valores nulos son falsos, pero debería ser obvio que el FWER sería 0, y por lo tanto <.05.
fuente
Creo que finalmente tengo la respuesta. Necesito un requisito adicional sobre la distribución de . Antes, solo requería que sea uniforme entre 0 y 1. En este caso, mi ejemplo es correcto y Bonferroni sería demasiado liberal. Sin embargo, si además requiero la uniformidad de , es fácil deducir que Bonferroni nunca puede ser demasiado conservador. Mi ejemplo viola esta suposición. En términos más generales, la suposición es que la distribución de todos los valores p dado que todas las hipótesis nulas son verdaderas debe tener la forma de una cópula : en conjunto no necesitan ser uniformes, pero marginalmente sí.P(p1,p2|H1=0,H2=0) P(p1|H1=0) P(p1|H1=0,H2=0)
Comentario: si alguien puede señalarme una fuente donde esta suposición está claramente establecida (libro de texto, papel), aceptaré esta respuesta.
fuente