¿Qué significa hacer que el tamaño de la muestra sea una variable aleatoria?

18

Frank Harrell ha comenzado un blog ( Pensamiento estadístico) . En su publicación principal , enumera algunas características clave de su filosofía estadística. Entre otros artículos, incluye:

  • Convertir el tamaño de la muestra en una variable aleatoria cuando sea posible
  1. ¿Qué significa "hacer que el tamaño de la muestra sea una variable aleatoria"?
  2. ¿Cuáles son las ventajas de hacer esto? ¿Por qué podría ser preferible?
gung - Restablece a Monica
fuente
En el análisis secuencial, el tiempo de ocurrencia de un evento se trata como una variable aleatoria. Eso también es cierto sobre el tamaño de la muestra.
Michael R. Chernick
@ Richard Hardy, esto debería discutirse en Meta de validación cruzada . Creé la etiqueta b / c, no teníamos 1 y hay muchas preguntas sobre ACF, etc. Siempre podríamos convertirlo en sinónimo.
gung - Restablece a Monica

Respuestas:

13

No pretendo usar modelos cercanos al proceso de recopilación de datos, sino más bien hacer un monitoreo bayesiano continuo de las probabilidades posteriores, que no requieren penalización por multiplicidad. En lugar de calcular un tamaño de muestra objetivo arbitrario, preferiría calcular un tamaño de muestra máximo posible (para la aprobación del presupuesto) y, de lo contrario, detener "cuando obtengamos la respuesta", como generalmente se hace con buenos resultados en física. Diré más sobre eso en mi blog http://fharrell.com algún día en poco tiempo.

Frank Harrell
fuente
1
¿Qué significa concretamente "cuando obtengamos la respuesta"? Creo que ejecutar un estudio hasta que obtenga un resultado que le haya gustado (por ejemplo, un intervalo creíble del 95% no incluye 0) sería tan corruptora en un contexto bayesiano como en uno frecuente.
gung - Restablece a Monica
1
@gung en absoluto. La inferencia bayesiana es completamente independiente de la regla de detención. Es fácil simular la calibración de probabilidades posteriores en el momento de la detención temprana, mostrando que son exactamente correctas. Esta es una de las sorprendentes diferencias con el mundo frecuentista. En general, las probabilidades hacia adelante no tienen contexto y las probabilidades hacia atrás dependen de cómo llegaste allí. Por lo tanto, me detendría cuando la probabilidad posterior de que el efecto sea> 0 exceda algún número, como 0,95 o cuando el intervalo creíble tenga un ancho <algún número especificado.
Frank Harrell
1
Su respuesta al comentario de @gung me parece que plantea la pregunta: algunos lectores pueden sentir que si la inferencia bayesiana realmente permite "muestrear hasta una conclusión inevitable", tanto peor para la inferencia bayesiana. (Me referiría a las referencias en el tercer párrafo aquí .) ¡Espero su próxima publicación en el blog!
Scortchi - Restablece a Monica
El muestreo a una conclusión incorrecta inevitable solo ocurre si lo anterior utilizado por el estadístico entra en conflicto con lo anterior utilizado por el revisor. Por ejemplo, si el revisor coloca una masa de probabilidad en el nulo (es decir, el anterior tiene un estado de absorción) y el modelo utilizado no pone especial énfasis en el nulo, el análisis puede indicar detenerse para un efecto positivo, pero el revisor dice que hay evidencia insuficiente para un efecto. Si simula estudios con un determinado previo y analiza utilizando el mismo previo, los probs posteriores están perfectamente calibrados, y los medios posteriores también son perfectos.
Frank Harrell