El ajuste de Bonferroni siempre proporcionará un fuerte control de la tasa de error familiar. Esto significa que, cualquiera que sea la naturaleza y el número de las pruebas, o las relaciones entre ellas, si se cumplen sus supuestos, se asegurará de que la probabilidad de tener incluso un resultado significativo erróneo entre todas las pruebas sea a lo sumo , su nivel de error original . Por lo tanto, siempre está disponible .α
Si es apropiado usarlo (a diferencia de otro método o quizás ningún ajuste) depende de sus objetivos, los estándares de su disciplina y la disponibilidad de mejores métodos para su situación específica. Como mínimo, probablemente debería considerar el método Holm-Bonferroni, que es tan general pero menos conservador.
Con respecto a su ejemplo, dado que está realizando varias pruebas, está aumentando la tasa de error familiar (la probabilidad de rechazar erróneamente al menos una hipótesis nula). Si solo realiza una prueba en cada mitad, serían posibles muchos ajustes, incluido el método de Hommel o los métodos que controlan la tasa de descubrimiento falso (que es diferente de la tasa de error familiar). Si realiza una prueba en todo el conjunto de datos seguido de varias subpruebas, las pruebas ya no son independientes, por lo que algunos métodos ya no son apropiados. Como dije antes, Bonferroni está en cualquier caso siempre disponible y garantizado para funcionar como se anuncia (pero también para ser muy conservador ...).
También podría ignorar todo el problema. Formalmente, la tasa de error familiar es más alta, pero con solo dos pruebas todavía no es tan mala. También puede comenzar con una prueba en todo el conjunto de datos, tratada como el resultado principal, seguida de subpruebas para diferentes grupos, sin corregir porque se entienden como resultados secundarios o hipótesis auxiliares.
Si considera muchas variables demográficas de esa manera (en lugar de solo planear probar las diferencias de género desde el principio o tal vez un enfoque de modelado más sistemático), el problema se vuelve más grave con un riesgo significativo de "dragado de datos" (una diferencia resulta significativo por casualidad, lo que le permite rescatar un experimento no concluyente con una buena historia sobre la variable demográfica para arrancar, mientras que en realidad no sucedió nada) y definitivamente debe considerar alguna forma de ajuste para múltiples pruebas. La lógica sigue siendo la misma con X hipótesis diferentes (probar dos hipótesis X dos veces, una en cada mitad del conjunto de datos) implica una tasa de error familiar más alta que probar las hipótesis X solo una vez y probablemente debería ajustarse para eso).
Estaba mirando el mismo problema y encontré un texto en el libro:
Una copia del capítulo relevante está disponible gratuitamente aquí:
http://www.utdallas.edu/~herve/Abdi-Bonferroni2007-pretty.pdf
Para ser justos, he mirado muchos artículos económicos / econométricos diferentes para mi proyecto de investigación actual y en esa experiencia limitada no he encontrado muchos artículos que apliquen tales correcciones al comparar 2-5 pruebas.
fuente
Debe recordar que los datos médicos y los datos científicos son irreconciliablemente diferentes en el sentido de que los datos médicos heteroscedasticos nunca son experimentales, a diferencia de los datos biológicos homoscedasticos. Recuerde también que muchas discusiones sobre el papel de las pruebas de potencia y las correcciones de tipo Bonferroni implican solo especulaciones sobre la naturaleza de las distribuciones alternativas desconocidas. Establecer beta en un cálculo de potencia es un procedimiento arbitrario. Ninguno de los estadísticos médicos anuncia esto. En segundo lugar, si hay autocorrelación de (dentro) muestras de datos, se ha violado el teorema del límite central y las pruebas gaussianas basadas en normal no son válidas. Tercero, recuerde que la Distribución Normal está quedando obsoleta en el sentido de que muchos fenómenos médicos son distribuciones basadas en fractales que no poseen medios finitos y / o variaciones finitas (distribuciones de tipo Cauchy) y requieren análisis estadísticos resistentes a fractales. Llevar a cabo cualquier análisis de respuesta post hoc sobre lo que encuentre durante el análisis inicial es incorrecto. Finalmente, la biyectividad entre sujetos no es necesariamente válida y las condiciones para las correcciones de Bonferroni son elementos importantes que se deben descubrir de manera exclusiva solo durante el diseño experimental a priori. Nigel T. James. MB BChir, (títulos médicos del Reino Unido), MSc (en Estadística Aplicada). la biyectividad entre sujetos no es necesariamente válida y las condiciones para las correcciones de Bonferroni son elementos importantes que se deben descifrar únicamente durante el diseño experimental a priori únicamente. Nigel T. James. MB BChir, (títulos médicos del Reino Unido), MSc (en Estadística Aplicada). la biyectividad entre sujetos no es necesariamente válida y las condiciones para las correcciones de Bonferroni son elementos importantes que se deben descifrar únicamente durante el diseño experimental a priori únicamente. Nigel T. James. MB BChir, (títulos médicos del Reino Unido), MSc (en Estadística Aplicada).
fuente