Tengo un conjunto de datos donde pruebo las diferencias significativas entre tres poblaciones con respecto a unas 50 variables diferentes. Hago esto usando las pruebas de Kruskal-Wallis, por un lado, y las pruebas de razón de probabilidad de ajustes de modelos GLM anidados (con y sin población como una variable independiente), por el otro.
Como resultado, tengo una lista de los valores de Kruskal-Wallis por un lado, y lo que creo que son los valores p de Chi cuadrado de las comparaciones LRT, por el otro.
Necesito hacer alguna forma de corrección de pruebas múltiples, ya que hay> 50 pruebas diferentes, y Benjamini-Hochberg FDR parece ser la opción más sensata.
Sin embargo, las variables probablemente no son independientes, con varios "clanes" de ellos correlacionados. La pregunta es entonces: ¿cómo puedo saber si el conjunto de estadísticas subyacentes para mis valores cumple con los requisitos de dependencia positiva que se necesitan para que el procedimiento de Benjamini-Hochberg siga vinculado al FDR?
El artículo de Benjamini-Hochberg-Yekutieli de 2001 afirma que la condición de PRDS es válida para la distribución multivariada normal y estudiantil. ¿Qué pasa con mis valores de Chi cuadrado de prueba de razón de probabilidad para la comparación del modelo? ¿Qué pasa con los valores que tengo para las pruebas de Kruskal-Wallis?
Puedo usar la corrección FDR del caso más desfavorable de Benjamini-Hochberg-Yekutieli que no supone nada en la dependencia, pero creo que puede ser demasiado conservador en este caso y perder algunas señales relevantes.
PRDS es una condición suficiente pero no necesaria para que BH controle el FDR. Sugeriría que lo use, y también use el procedimiento Benjamini-Yekutieli para la dependencia general. Si la diferencia de inferencia es grande, intente demostrar que BH controla el FDR en su configuración particular utilizando permutaciones o técnicas basadas en remuestreo que conservan su estructura de dependencia.
fuente