Error general de tipo I al probar repetidamente datos acumulados

Tengo una pregunta sobre los métodos secuenciales grupales .

De acuerdo con Wikipedia:

En un ensayo aleatorizado con dos grupos de tratamiento, las pruebas secuenciales de grupo clásico se usan de la siguiente manera: si hay n sujetos en cada grupo disponibles, se realiza un análisis intermedio de los 2n sujetos. El análisis estadístico se realiza para comparar los dos grupos, y si se acepta la hipótesis alternativa, el ensayo finaliza. De lo contrario, el ensayo continúa para otros 2n sujetos, con n sujetos por grupo. El análisis estadístico se realiza nuevamente en los 4n sujetos. Si se acepta la alternativa, entonces se termina el juicio. De lo contrario, continúa con evaluaciones periódicas hasta que estén disponibles N conjuntos de 2n asignaturas. En este punto, se realiza la última prueba estadística y se suspende el ensayo.

Pero al probar repetidamente los datos acumulados de esta manera, el nivel de error tipo I se infla ...

$\alpha^{\star}$

$\alpha^{\star} = 1 - (1 - \alpha)^k$

$\alpha$ $k$

Pero las muestras no son independientes ya que se superponen. Suponiendo que los análisis intermedios se realizan con incrementos de información iguales, se puede encontrar que (diapositiva 6)

ingrese la descripción de la imagen aquí

¿Me puede explicar cómo se obtiene esta tabla?

multiple-comparisons clinical-trials type-i-and-ii-errors ocram
fuente

Respuestas:

Las siguientes diapositivas, a través de 14, explican la idea. El punto, como notará, es que la secuencia de estadísticas está correlacionada.

$z_1$ $\Phi$ $z_2$ $\sqrt{1/2}$ $(z_1, z_2)$ $c = \Phi^{-1}(1 - 0.05/2)$ $\alpha$ $|z_1| > c$ $|z_1| \le c$ $|z_2| > c$

Este gráfico representa el pdf binormal y la región de integración (superficie sólida). Binormal PDF, diagrama de superficie 3D

whuber
fuente

¡Entendido, gracias! ¿Es difícil obtener la correlación cor (z1, z2)?

ocram

z_{1}

$z_1$

z_{1} - z_{2}

$z_1 - z_2$

Muchas gracias. Sí, la correlación parece bastante fácil de calcular. En realidad, no estaba claro para mí que el contexto fuera una comparación de las medias de dos distribuciones normales. ¡Ahora está claro y tú también aclaras todo lo demás! ¡Gracias!

ocram

¿podría proporcionar una fórmula (o código R) para calcular esto, por ejemplo, n = 400? Lo haría solo, pero desafortunadamente no sé cómo. ¿Y cómo tendría que ajustar la fórmula si quiero calcular la tasa de error general si tengo múltiples comparaciones (por ejemplo, comparando 4 proporciones) y no hago una corrección como Bonferroni y hago pruebas repetidas? ¿Podías ayudarme con esto?

Andreas