¿Cuáles son los supuestos de la prueba de permutación?

22

A menudo se dice que las pruebas de permutación no tienen suposiciones, sin embargo, esto ciertamente no es cierto. Por ejemplo, si mis muestras están de alguna manera correlacionadas, puedo imaginar que permutar sus etiquetas no sería lo correcto. Solo creo que encontré sobre este problema esta frase de wikipedia: "Una suposición importante detrás de una prueba de permutación es que las observaciones son intercambiables bajo la hipótesis nula". Lo cual no entiendo.

¿Cuáles son los supuestos de las pruebas de permutación? ¿Y cómo se conectan estos supuestos con diferentes esquemas de permutación posibles?

rep_ho
fuente
44
(+1) La cita de Wikipedia, aunque es correcta, es algo graciosa, porque cuando superas la jerga técnica (que oculta) todo se reduce a decir que debes permutar exactamente esas observaciones que supones que puedes permutar.
whuber
1
Difícil de responder ya que hay tantas pruebas de permutación diferentes. Por ejemplo, para una comparación de muestras k, la heterocedasticidad entre grupos violaría el supuesto de intercambiabilidad.
Michael M
1
(+1) Basado en Rubin (2015) "Causal Inference for Statistics", cuando la etiqueta (o el tratamiento) es independiente de los resultados potenciales, entonces puede usar la prueba de permutación. La lógica es para cada sujeto, tiene dos resultados potenciales bajo la etiqueta A y B, son fijos. El procedimiento de asignación de etiquetas es aleatorio y si es independiente del resultado potencial, puede pensar en realizar este procedimiento de asignación de etiquetas N veces, N es el número total de permutaciones de las etiquetas, entonces puede obtener una distribución de la estadística que preocuparse. Luego verifica el cuantil de la cantidad observada
KevinKim

Respuestas:

17

La literatura distingue entre dos tipos de pruebas de permutaciones: (1) la prueba de aleatorización es la prueba de permutación donde la intercambiabilidad se satisface mediante la asignación aleatoria de unidades experimentales a las condiciones; (2) la prueba de permutación es exactamente la misma prueba, pero se aplica a una situación en la que se necesitan otras suposiciones (es decir, distintas de la asignación aleatoria) para justificar la intercambiabilidad.

Algunas referencias con respecto a las convenciones de nomenclatura (es decir, aleatorización vs permutación): Kempthorne y Doerfler, Biometrika, 1969; Edgington & Onghena, Pruebas de aleatorización, 4ª ed., 2007

Para los supuestos, la prueba de aleatorización (es decir, la prueba de aleatorización de Fisher para datos experimentales) solo requiere lo que Donald Rubin se refiere como el supuesto de valor de tratamiento de unidad estable (SUTVA). Vea el comentario de Rubin en 1980 sobre el artículo de Basu en JASA. SUTVA es también uno de los supuestos fundamentales (junto con una fuerte ignorancia) para la inferencia causal bajo el modelo de resultados potenciales de Neyman-Rubin (véase el artículo JASA de 1986 de Paul Holland). Esencialmente, SUTVA dice que no hay interferencia entre las unidades y que las condiciones de tratamiento son las mismas para todos los receptores. Más formalmente, SUTVA asume independencia entre los resultados potenciales y el mecanismo de asignación.

Considere el problema de dos muestras con participantes asignados aleatoriamente a un grupo de control o un grupo de tratamiento. Se violaría SUTVA si, por ejemplo, dos participantes del estudio se conocieran y el estado de asignación de uno de ellos ejerciera cierta influencia en el resultado del otro. Esto es lo que se entiende por no interferencia entre unidades.

La discusión anterior se aplica a la prueba de aleatorización en la que los participantes fueron asignados aleatoriamente a grupos. En el contexto de una prueba de permutación, SUTVA también es necesario, pero puede que no descanse en la aleatorización porque no había ninguna.

En ausencia de una asignación aleatoria, la validez de las pruebas de permutación puede basarse en supuestos de distribución como una forma de distribución idéntica o distribuciones simétricas (según la prueba) para satisfacer la intercambiabilidad (ver Box y Anderson, JRSSB, 1955).

En un artículo interesante, Hayes, Psych Methods, 1996, muestra a través de la simulación cómo las tasas de error de Tipo I pueden inflarse si se usan pruebas de permutación con datos no aleatorios.

bsbk
fuente
-5

Consulte "Una cartilla sobre análisis de datos cuantificados y pruebas de permutación" (página 88).

Davester
fuente
1
(-) Dar una cita no es una respuesta. En primer lugar, alguien no podría tener el libro que usted cita. En segundo lugar, ni siquiera proporciona una referencia válida, ¡así que solo podemos adivinar qué cita!
Tim
1
Busqué ese documento (es de libre acceso, por cierto: ¡gracias!). Sin embargo, no responde la pregunta. Todos los estados de relevancia en la p. 88 es "La prueba de permutación no se basa en supuestos de distribución tradicionales; más bien, se basa en el modelo de aleatorización de RA Fisher (1935/1990)". Le agradeceríamos si se sintiera inclinado a elaborar esto en una respuesta ampliada.
whuber
El documento da referencias a dónde puede ir para encontrar supuestos de pruebas de permutación. Lo siento, pero no tengo tiempo para buscar a la persona que hizo la pregunta.
Davester
1
Entonces en realidad no respondiste la pregunta.
neuronet