¿Tiene sentido realizar una prueba de Kolmogorov-Smirnov de una cola?

15

¿Es significativo y posible realizar una prueba KS de una cola? ¿Cuál sería la hipótesis nula de tal prueba? ¿O la prueba KS es inherentemente una prueba de dos colas?

Me beneficiaría una respuesta que me ayudara a comprender la distribución de D (estoy trabajando en el artículo de 1951 de Massey, y encontrar la descripción desafiante, por ejemplo, y el supremum y el infimum de las diferencias del valor no absoluto de las diferencias en los CDF empíricos?).D+D

Pregunta de seguimiento: ¿cómo se obtienen los valores para y ? Muchas de las publicaciones con las que me encuentro presentan valores en tablas, en lugar de CDF de , y .pD+DDnD+D

Actualización: acabo de descubrir la pregunta relacionada ¿ Cuál es la hipótesis nula en una prueba unilateral de Kolmogorov-Smirnov? , que me perdí en mi escaneo inicial antes de escribir este.

Alexis
fuente

Respuestas:

20

¿Es significativo y posible realizar una prueba KS de una cola?

Seguro.

¿Es la prueba KS inherentemente una prueba de dos colas?

De ningún modo.

¿Cuál sería la hipótesis nula de tal prueba?

No deja en claro si está hablando de la prueba de una muestra o de las dos muestras. Mi respuesta aquí cubre ambos: si considera que representa el cdf de la población de la que se extrajo una muestra , es de dos muestras, mientras obtiene el caso de una muestra al considerar como una distribución hipotética ( X F XFXXFX , si preferir).F0

En algunos casos, podría escribir el nulo como una igualdad (por ejemplo, si no se veía como posible que fuera al revés), pero si desea escribir un nulo direccional para una alternativa de una cola, podría escribir algo como esto :

H0:FY(t)FX(t)

H1:FY(t)<FX(t), por al menos una t

(o su inversa para la otra cola, naturalmente)

Si agregamos una suposición cuando usamos la prueba de que son iguales o que será más pequeña, entonces el rechazo de la nula implica un orden estocástico (primer orden) / dominio estocástico de primer orden . En muestras lo suficientemente grandes, es posible que las F se crucen, incluso varias veces, y aún así rechacen la prueba unilateral, por lo que la suposición es estrictamente necesaria para que se mantenga el dominio estocástico.FY

Libremente si con desigualdad estricta para al menos algunos t entonces Y 'tiende a ser más grande' que X .FY(t)FX(t)tYX

Agregar suposiciones como esta no es extraño; Es estándar. No es particularmente diferente de suponer (digamos en un ANOVA) que una diferencia en los medios se debe a un cambio de toda la distribución (en lugar de un cambio en la asimetría, donde parte de la distribución se desplaza hacia abajo y algunos hacia arriba, pero en tal forma en que la media ha cambiado).


Así que consideremos, por ejemplo, un cambio en la media para un normal:

ingrese la descripción de la imagen aquí

El hecho de que la distribución de se desplaza a la derecha por una cierta cantidad de la de X implica que F Y es menor que F X . La prueba unilateral de Kolmogorov-Smirnov tenderá a rechazar en esta situación.YXFYFX

Del mismo modo, considere un cambio de escala en una gamma:

ingrese la descripción de la imagen aquí

Nuevamente, el cambio a una escala mayor produce una F. más baja. Nuevamente, la prueba unilateral de Kolmogorov-Smirnov tenderá a rechazarse en esta situación.

Existen numerosas situaciones en las que dicha prueba puede ser útil.


D+D

En la prueba de una muestra, es la desviación positiva máxima del cdf de muestra de la curva hipotética (es la distancia más grande que el ECDF está por encima de F 0 , mientras que D -D+F0DF0D+D

ingrese la descripción de la imagen aquí

D+D

H0:FY(t)F0(t)

H1:FY(t)<F0(t), por al menos una t

Para probar esto, queremos que la sensibilidad a sea ​​estocásticamente más grande de lo hipotético (su verdadero F es menor que F 0 ). Entonces, valores inusualmente grandes de D - tenderán a ocurrir cuando la alternativa sea verdadera. Como resultado, para probar contra la alternativa F Y (YFF0DFY(t)<F0(t)D


D+D

No es una cosa simple. Hay una variedad de enfoques que se han utilizado.

Si recuerdo correctamente una de las formas en que se obtuvo la distribución mediante el uso de procesos de puente browniano ( este documento parece respaldar ese recuerdo ).

Creo que este documento, y el artículo de Marsaglia et al. Aquí, cubren parte de los antecedentes y ofrecen algoritmos computacionales con muchas referencias.

Entre ellos, obtendrá una gran parte de la historia y varios enfoques que se han utilizado. Si no cubren lo que necesita, probablemente tendrá que hacer esto como una nueva pregunta.

Dnre+re-

Eso no es particularmente una sorpresa. Si recuerdo bien, incluso la distribución asintótica se obtiene como una serie (este recuerdo bien sería incorrecto), y en muestras finitas es discreta y no de forma simple. En cualquier caso, y no hay una forma conveniente de presentar la información, excepto como un gráfico o una tabla.

Glen_b -Reinstate a Monica
fuente
2
"En muestras lo suficientemente grandes, es posible que las F se crucen, incluso varias veces, y aún así rechacen la prueba unilateral". ¡Tenga en cuenta que esto significa que puede rechazar la prueba unilateral en ambas direcciones para obtener los mismos datos!
Hao Ye
2
@HaoYe Sí, eso es posible. Sería una clara indicación de que el dominio estocástico sería insostenible.
Glen_b -Reinstalar Monica