Al probar algunos nula frente a hipótesis alternativas por una prueba estadística , donde , aplicamos la prueba de permutación con el conjunto de permutaciones en y tenemos una nueva estadística
¿Cuál es el beneficio de usar la prueba de permutación sobre no usarla? Es decir, ¿cómo es cuando funciona la prueba de permutación?
¿Qué condiciones para que eso suceda? ¿Como algunas condiciones en el estadístico de prueba y / o en la hipótesis nula?
Por ejemplo,
¿Debería ser igual al valor p basado en , para la muestra ? ¿Si es así por qué? (también se agradecen las referencias)
U(X) | X=xT(X)U(X)X=xHT(X) sup F ∈ H inf c : U
¿Debería la prueba de permutación hacer que esté libre de distribución sobre las hipótesis nulas? ¿Qué condiciones harán que eso suceda?
¿Debería distribuirse uniformemente en ? ¿Qué condiciones harán que eso suceda? Observe que cuando es una función constante, también es constante en y la distribución de está lejos de ser uniforme en .[ 0 , 1 ] U ( ⋅ ) T ( ⋅ ) 1 T ( X ) [ 0 , 1 ]
¡Gracias y saludos!
Respuestas:
Como la discusión creció mucho, he llevado mis respuestas a una respuesta. Pero he cambiado el orden.
Las pruebas de permutación son "exactas", en lugar de asintóticas (compárese con, por ejemplo, pruebas de razón de probabilidad). Entonces, por ejemplo, puede hacer una prueba de medias incluso sin poder calcular la distribución de la diferencia de medias bajo nulo; ni siquiera necesita especificar las distribuciones involucradas. Puede diseñar una estadística de prueba que tenga un buen poder bajo un conjunto de supuestos sin ser tan sensible a ellos como una suposición totalmente paramétrica (puede usar una estadística que sea robusta pero tenga un buen ARE).
Tenga en cuenta que las definiciones que da (o más bien, quienquiera que esté citando allí da) no son universales; algunas personas llamarían a U una estadística de prueba de permutación (lo que hace que una prueba de permutación no sea la estadística sino cómo evalúa el valor p). Pero una vez que esté haciendo una prueba de permutación y haya asignado una dirección ya que 'los extremos de esto son inconsistentes con H0', ese tipo de definición para T anterior es básicamente cómo calcula los valores p: es solo la proporción real de distribución de permutación al menos tan extrema como la muestra bajo nulo (la definición misma de un valor p).
Entonces, por ejemplo, si quiero hacer una prueba (de una cola, por simplicidad) de medios como una prueba t de dos muestras, podría hacer que mi estadística sea el numerador de la estadística t, o la estadística t misma, o la suma de la primera muestra (cada una de esas definiciones es monotónica en las otras, condicional a la muestra combinada), o cualquier transformación monotónica de ellas, y tienen la misma prueba, ya que producen valores p idénticos. Todo lo que necesito hacer es ver hasta qué punto (en términos de proporción) la distribución de permutación de cualquier estadística que elija, miente la estadística de la muestra. T como se definió anteriormente es solo otra estadística, tan buena como cualquier otra que pueda elegir (T como se define allí es monótono en U).
T no será exactamente uniforme, porque eso requeriría distribuciones continuas y T es necesariamente discreto. Debido a que U y, por lo tanto, T pueden asignar más de una permutación a una estadística dada, los resultados no son equitativos, pero tienen un cdf ** "uniforme", pero uno donde los pasos no son necesariamente de igual tamaño .
** ( , y estrictamente igual a él en el límite derecho de cada salto; probablemente haya un nombre para lo que realmente es)F( x ) ≤ x
Para estadísticas razonables cuando va al infinito, la distribución de aproxima a la uniformidad. Creo que la mejor manera de comenzar a comprenderlos es realmente hacerlo en una variedad de situaciones.norte T
T es el valor p (para los casos en que U grande indica desviación del valor nulo y U pequeño es consistente con él). Tenga en cuenta que la distribución es condicional en la muestra. Por lo tanto, su distribución no es 'para ninguna muestra'.
Ya he explicado que T no es uniforme.
Creo que ya he explicado lo que veo como los beneficios de las pruebas de permutación; otras personas sugerirán otras ventajas ( p . ej .).
La oración que citó indica explícitamente que T es un valor p, y cuándo lo es. Si puede explicar lo que no está claro al respecto, tal vez podría decir más. En cuanto a por qué, vea la definición del valor p (primera oración en el enlace): se deduce directamente de eso
Hay una buena discusión primaria de las pruebas de permutación aquí .
-
Editar: agrego aquí un pequeño ejemplo de prueba de permutación; este código (R) solo es adecuado para muestras pequeñas: necesita mejores algoritmos para encontrar las combinaciones extremas en muestras moderadas.
Considere una prueba de permutación contra una alternativa de una cola:
* pero generalmente lo evito porque particularmente tiende a confundir el problema para los estudiantes cuando tratan de resolver distribuciones nulas
en los siguientes datos:
Hay 35 formas de dividir las 7 observaciones en muestras de tamaño 3 y 4:
Como se mencionó anteriormente, dados los 7 valores de datos, la suma de la primera muestra es monotónica en la diferencia de medias, así que usemos eso como estadística de prueba. Entonces la muestra original tiene una estadística de prueba de:
Ahora aquí está la distribución de permutación:
(No es esencial ordenarlos, solo hice eso para que sea más fácil ver que la estadística de prueba era el segundo valor desde el final).
Podemos ver (en este caso por inspección) que es 2/35, opag
(Tenga en cuenta que solo en el caso de que no se superponga xy es posible un valor p por debajo de .05 aquí. En este caso, sería discreto uniforme porque no hay valores vinculados en ).T U
Las flechas rosadas indican el estadístico de muestra en el eje xy el valor p en el eje y.
fuente