Estoy usando la prueba de dos muestras de Kolmogorov-Smirnov para comparar distribuciones, y noté que un valor se informa con frecuencia como estadística de prueba. ¿Cómo se determina este valor ? Sé que es la probabilidad de obtener un resultado al menos tan grande como el obtenido, pero ¿cómo se determina este valor dado que esta es una prueba no paramétrica? Es decir, no podemos suponer fluctuaciones gaussianas en la distribución y calcular el valor usando una prueba .
¡Gracias!
kolmogorov-smirnov
C. Reed
fuente
fuente
Respuestas:
Bajo la hipótesis nula, la distribución asintótica del estadístico de Kolmogorov-Smirnov de dos muestras es la distribución de Kolmogorov, que tiene CDF
Los valores se pueden calcular a partir de este CDF; consulte la Sección 4 y la Sección 2 de la página de Wikipedia sobre la prueba de Kolmogorov-Smirnov.p
Parece que está diciendo que una estadística de prueba no paramétrica no debería tener una distribución, ese no es el caso, lo que hace que esta prueba no sea paramétrica es que la distribución de la estadística de prueba no depende de la distribución de probabilidad continua de los datos originales. viene de. Tenga en cuenta que la prueba KS tiene esta propiedad incluso para muestras finitas como se muestra en @cardinal en los comentarios.
fuente
El valor p de, digamos 0.80, implica que el 80% de las muestras de tamaño n de muestras de la población tendrán una estadística D menor que la obtenida de la prueba. Esto se calcula con base en la estadística D de la prueba KS, que mide la distancia máxima entre los CDF de distribución teórica y empírica, para la distribución dada contra la cual se evalúa la muestra.
Tenga en cuenta que solo el valor D * SQRT (tamaño de muestra) tiene una distribución kolmogrov y no D en sí. Si desea calcular manualmente el valor p dado el valor D, puede consultar las tablas publicadas disponibles en Internet para la distribución de kolomogrov. Este es también el valor dado en paquetes como R
fuente