Parece una pregunta bastante sencilla, pero cuando realmente lo pienso, el método de Stouffer no tiene sentido para mí. Esta es la razón por:
Suponga una hipótesis de dos colas. Primero calculas desde -valores. Así que tomemos un ejemplo bastante simple. Tomemos dos-valores de . Esto significa que y son ambos . Según el método de Stouffer, y se combinan de manera que:
Esta -score luego se convierte en un -valor una vez más, lo que resulta en un -valor de , mientras que el -valores de cada individualmente se trata .
En este sentido, parece que la prueba de Stouffer cambia artificialmente la resultante -valor a un valor diferente al -valores de cada , lo que para mí no tiene sentido.
¿Estoy malinterpretando esta prueba o alguien puede ayudarme a entender cómo / por qué funciona?
R
, calcular usandoprop.test(535,1000)
, etc.)Respuestas:
El mayor tamaño general de la muestra conduce a una mayor potencia y, por lo tanto, a un valor p más pequeño (al menos si los datos respaldan la hipótesis de trabajo).
Este suele ser el punto principal de cualquier metanálisis: múltiples evidencias débiles que respaldan una hipótesis se combinan con una fuerte evidencia de ello.
fuente
Para simplificar, piense en términos de una prueba de medios. Suponga que bajo H0 el efecto del tratamiento es cero, de modo que cada valor z es una estimación ponderada del efecto del tratamiento θi. El método de Stouffer proporciona un promedio no ponderado de estos efectos del tratamiento, por lo que dará una estimación más precisa (y, por lo tanto, un valor p más pequeño) que cada valor z separado. Esta estimación no ponderada del efecto del tratamiento está sesgada, pero es posible un método de Stouffer ponderado, y si los pesos son proporcionales a 1 / error estándar (θi) la estimación del efecto del tratamiento es imparcial. Sin embargo, esto solo tiene sentido si los valores z separados son medidas de la misma cantidad. Una ventaja de los métodos de Stouffer y Fisher es que también se pueden aplicar a metanálisis donde se han elegido diferentes variables de respuesta, para que puedan '
fuente
Piénselo desde el punto de vista del metanálisis: si no hubiera ningún efecto (H0 ), p los valores se distribuirían por igual entre 0 y 1. Entonces, si obtiene p<0.1 en más del 10% de todos los análisis individuales (potencialmente muchos de ellos), esto puede llegar a la conclusión de que H0 Probablemente debería ser rechazado.
Ni siquiera veo un problema para las pruebas de dos colas: en este caso, el resultado debe interpretarse como: Es poco probable que la media real sea 0 (en el ejemplo de un gaussiano alrededor de 0), pero no puedo decirlo (de cualquiera el anterior o el combinadop valor) si la media verdadera está por encima o por debajo de ella.
fuente
Creo que estaría bien combinar resultados de 2 colas porque eso significa que el resultado sería cero (si hay evidencia de que el tratamiento mejora [la cola derecha] de la enfermedad de un paciente pero también evidencia de que empeora [izquierda -tail], el resultado neto no es evidencia hacia una hipótesis particular ya que se cancelan y se necesitan más observaciones.
fuente