Calcular el valor p en bootstrap emparejado

8

Me encontré con un nuevo artículo del grupo Berkeley PNL sobre pruebas estadísticas, Una investigación empírica de significación estadística en PNL .

Hay un seudocódigo para calcular un valor p en el documento, básicamente, la idea es que el conjunto de muestra de X1,X2,...,Xnorte se muestrean con reemplazo de datos X. Entonces

valor p=contar(δ(Xyo)>2δ(X))/ /norte, dónde δ(Xyo) Es una ganancia métrica.

Pude entender la fórmula para calcular el valor p en las pruebas de significación estadística en papel de Koehn para la evaluación de traducción automática , en la que:

valor p=contar(δuna(Xyo)<δsi(Xyo))/ /norte, dónde δuna y δsi son la ganancia métrica para el sistema una y si respectivamente.

¿Hay alguna explicación o referencia para la fórmula? valor p=contar(δ(Xyo)>2δ(X))/ /norte. Los autores también señalaron que si la media deδ(Xyo) es δ(X) y δ(Xyo) es simétrico, entonces ambas fórmulas anteriores son equivalentes.

Ke Tran
fuente

Respuestas:

1

Según tengo entendido al mirar la sección 2, los autores parecen explicar su justificación para la prueba de arranque de la siguiente manera:

"la Xyo fueron muestreados de Xy su promedio δ(Xyo)no será cero como lo exige la hipótesis nula; el promedio en cambio estará alrededorδ(X)... La solución es volver a centrar la media: queremos saber con qué frecuencia UNA hace más que δ(X)mejor de lo esperado. Esperamos que venzasi por δ(X). Por lo tanto, contamos cuántas de lasXyo tener UNA golpeando si por lo menos δ(X)".

Los autores quieren probar si la ganancia no es cero, por lo que escriben el valor p δ(Xyo)<2δ(X) , que podría reescribirse como 0 0<2δ(X)-δ(Xyo); porquemi[δ(Xyo)]=δ(X) el RHS de la desigualdad se convierte en δ(X), Cuál es el H0 0 estaban buscando rechazar.

Sameer
fuente