Cálculo de tamaño de muestra paramétrico y análisis no paramétrico

12

Tengo curiosidad por saber si alguien tiene una referencia específica (texto o artículo de revista) para apoyar la práctica común en la literatura médica de realizar el cálculo del tamaño de la muestra utilizando métodos que son paramétricos (es decir, suponiendo una distribución normal y una cierta variación de las mediciones) cuando el análisis del resultado primario del ensayo se realizará utilizando métodos no paramétricos.

Un ejemplo: el resultado primario es el tiempo para vomitar después de administrar un determinado medicamento, que se sabe que tiene un valor medio de 20 minutos (SD 6 minutos), pero tiene una distribución notablemente sesgada a la derecha. El cálculo del tamaño de la muestra se realiza con los supuestos enumerados anteriormente, utilizando la fórmula

n(per-group)=f(α,β)×(2σ2/(μ1μ2)2) ,

donde cambia según los errores deseados y .α βf(α,β)αβ

Sin embargo, debido a la asimetría de la distribución, el análisis del resultado primario se basará en los rangos (método no paramétrico como la prueba U de Mann Whitney).

¿Es este esquema compatible con los autores en la literatura estadística, o deberían realizarse estimaciones no paramétricas del tamaño de la muestra (y cómo se harían)?

Mis pensamientos son que, para facilitar el cálculo, es aceptable hacer la práctica anterior. Después de todo, las estimaciones del tamaño de la muestra son solo eso: estimaciones que ya hacen varias suposiciones, todas las cuales probablemente sean ligeramente (¡o muy!) Imprecisas. Sin embargo, tengo curiosidad por saber lo que piensan los demás, y específicamente saber si hay alguna referencia para apoyar esta línea de razonamiento.

Muchas gracias por cualquier ayuda.

pmgjones
fuente

Respuestas:

4

A mí me suena dudoso. Los métodos no paramétricos casi siempre implican más grados de libertad que los métodos paramétricos y, por lo tanto, necesitan más datos. En su ejemplo particular, la prueba de Mann-Whitney tiene una potencia menor que la prueba t y, por lo tanto, se requieren más datos para la misma potencia y tamaño especificados.

Una manera simple de hacer el cálculo del tamaño de la muestra para cualquier método (no paramétrico o de otro tipo) es usar un enfoque de arranque.

Rob Hyndman
fuente
55
Estoy de acuerdo con usted, aunque la mayoría del cálculo del tamaño de la muestra que se realiza al diseñar ECA se basa en modelos paramétricos. Me gusta el enfoque bootstrap, pero parece que muy pocos estudios confían en él. Acabo de encontrar esos documentos que podrían ser interesantes: bit.ly/djzzeS , bit.ly/atCWz3 , y este va en la dirección opuesta bit.ly/cwjTHe para escalas de medición de salud.
chl
66
Estoy de acuerdo con el enfoque bootstrap. Pero el poder no es una función de los grados de libertad. En muchos casos, incluido este, la prueba de Mann-Whitney a menudo tiene mayor poder que la prueba t. Ver tbf.coe.wayne.edu/jmasm/sawilowsky_misconceptions.pdf . En general, el poder de una prueba paramétrica es bueno cuando las suposiciones paramétricas son verdaderas pero pueden ser menores, a veces drásticamente, cuando se violan esas suposiciones, mientras que las buenas pruebas no paramétricas mantienen su poder.
whuber
@RobHyndman: lamento desenterrar un hilo antiguo de hace 6 años, pero me pregunto si puede proporcionar una referencia para su última oración. ¿Cómo puedo usar un enfoque de arranque para obtener un cálculo del tamaño de la muestra? Supongo que todavía no he reunido los datos (porque estoy tratando de averiguar cuánto reunir), pero sé la potencia que quiero, el nivel de importancia y el tamaño del efecto que quiero detectar. ¡Gracias!
David White
De acuerdo, supongo que esto solo puede funcionar si tiene un estudio preliminar para volver a muestrear. Para un estudio por primera vez sin conocimiento previo, parece mejor calcular el tamaño del efecto a partir de la distribución normal (o de una distribución diferente si la teoría sugiere que los datos deberían distribuirse de esa manera) y agregar un poco para tener en cuenta la posible no normalidad. Una vez que tenga un estudio, puede usar el boostrapping para calcular los tamaños de muestra para detectar varios tamaños de efectos en estudios posteriores. Incluso podría ajustar una curva de tamaño del efecto frente a n en función del arranque de varios valores de n.
David White
4

Algunas personas parecen usar un concepto de Eficiencia Relativa Asintótica de Pitman (ARE) para inflar el tamaño de muestra obtenido mediante el uso de una fórmula de tamaño de muestra para una prueba paramétrica. Irónicamente, para calcularlo, uno debe asumir una distribución nuevamente ... ver, por ejemplo, Tamaño de la muestra para la prueba U de Mann-Whitney. Hay algunos enlaces al final del artículo que proporcionan indicadores para leer más.

psj
fuente