Cuando las personas implementan pruebas de permutación para comparar una sola muestra con una media (por ejemplo, como podría hacer con una prueba t de permutación), ¿cómo se maneja la media? He visto implementaciones que toman una media y una muestra para una prueba de permutación, pero no está claro qué están haciendo realmente bajo el capó. ¿Existe incluso una manera significativa de hacer una prueba de permutación (por ejemplo, prueba t) para una muestra versus una media supuesta? O, alternativamente, ¿están simplemente en una prueba de no permutación bajo el capó? (p. ej., a pesar de llamar a una función de permutación o establecer un indicador de prueba de permutación, el valor predeterminado es una prueba t estándar o una función similar)
En una prueba de permutación estándar de dos muestras, uno tendría dos grupos y aleatorizaría la asignación de etiquetas. Sin embargo, ¿cómo se maneja esto cuando un "grupo" es una media asumida? Obviamente, una media supuesta no tiene un tamaño de muestra en sí mismo. Entonces, ¿cuál es la forma típica de trabajar la media en un formato de permutación? ¿Se supone que la muestra "media" es un punto único? ¿Una muestra de igual tamaño al grupo de muestra? ¿Una muestra de tamaño infinito?
Dado que una media asumida es, bueno, asumida, yo diría que técnicamente tiene soporte infinito o cualquier soporte que desee asumir. Sin embargo, ninguno de estos es muy útil para un cálculo real. Una muestra de igual tamaño con valores todos iguales a la media parece ser lo que se hace a veces con algunas pruebas (por ejemplo, simplemente completa la otra mitad de los pares con la ubicación supuesta). Esto tiene un poco de sentido, ya que es la muestra de igual longitud que vería si su media supuesta fuera correcta sin variación.
Entonces mi pregunta es esta: en la práctica, ¿emulan realmente las personas la aleatorización de etiquetas de estilo de prueba de permutación cuando el segundo conjunto es una media (o un valor supuesto abstracto similar)? Si es así, ¿cómo manejan las personas la aleatorización de etiquetas cuando hacen esto?
fuente
Respuestas:
Expandiendo el comentario de Glen_b en una respuesta
Una prueba de permutación aproximada de una muestra para la media de una muestra, contra una hipótesis nula de media cero, se implementa mediante la asignación de signos aleatorios a los datos de la muestra. Las hipótesis nulas distintas de cero se pueden probar restando la media nula deseada de los datos.
Esto es fácil de ver en la fuente de la función R
onetPermutation
en el paqueteDAAG
. Aquí hay un extracto del código relevante, con comentarios que agregué:fuente