Soy farmacólogo y, en mi experiencia, casi todos los trabajos de investigación biomédica básica utilizan la prueba t de Student (ya sea para respaldar la inferencia o para cumplir con las expectativas ...). Hace un par de años, me llamó la atención que la prueba t de Student no es la prueba más eficiente que podría usarse: las pruebas secuenciales ofrecen mucha más potencia para cualquier tamaño de muestra, o un tamaño de muestra mucho menor en promedio para una potencia equivalente.
Los procedimientos secuenciales de diversa complejidad se utilizan en la investigación clínica, pero nunca he visto uno utilizado en una publicación de investigación biomédica básica. Observo que también están ausentes de los libros de texto de estadísticas de nivel introductorio que son todo lo que la mayoría de los científicos básicos probablemente verán.
Mi pregunta es triple:
- Dada la ventaja de eficiencia muy sustancial de las pruebas secuenciales, ¿por qué no se usan más ampliamente?
- ¿Existe un inconveniente asociado con el uso de métodos secuenciales que significaría que su uso por parte de los no estadísticos debe ser desalentado?
- ¿Se les enseña a los estudiantes de estadística sobre los procedimientos de pruebas secuenciales?
fuente
Respuestas:
No conozco muchas pruebas secuenciales y su aplicación fuera del análisis intermedio (Jennison y Turnbull, 2000) y las pruebas adaptativas computarizadas (van der Linden y Glas, 2010). Una excepción se encuentra en algunos estudios de resonancia magnética funcional que están asociados a grandes costos y dificultades para inscribir sujetos. Básicamente, en este caso, las pruebas secuenciales apuntan principalmente a detener el experimento antes. Por lo tanto, no me sorprende que estos enfoques muy personalizados no se enseñen en las clases estadísticas habituales.
Sin embargo, las pruebas secuenciales no están exentas de dificultades (los errores de tipo I y II deben especificarse de antemano, la elección de la regla de detención y la observación múltiple de los resultados deben estar justificados, los valores de p no se distribuyen uniformemente bajo el valor nulo como en un valor fijo diseño de muestra, etc.). En la mayoría de los diseños, trabajamos con un entorno experimental previamente especificado o se realizó un estudio preliminar de potencia, para optimizar algún tipo de criterio de costo-efectividad, en cuyo caso se aplican los procedimientos de prueba estándar.
Sin embargo, encontré que el siguiente artículo de Maik Dierkes sobre diseño de muestra fijo versus abierto es muy interesante: un reclamo de diseños secuenciales de experimentos .
fuente