¿Puedo usar Kolmogorov-Smirnov para comparar dos distribuciones empíricas?

16

¿Está bien usar la prueba de bondad de ajuste de Kolmogorov-Smirnov para comparar dos distribuciones empíricas para determinar si parecen provenir de la misma distribución subyacente, en lugar de comparar una distribución empírica con una distribución de referencia preespecificada?

Déjame intentar preguntar esto de otra manera. Recojo N muestras de alguna distribución en una ubicación. Recojo M muestras en otra ubicación. Los datos son continuos (cada muestra es un número real entre 0 y 10, por ejemplo) pero normalmente no se distribuyen. Quiero probar si todas estas muestras de N + M provienen de la misma distribución subyacente. ¿Es razonable utilizar la prueba de Kolmogorov-Smirnov para este propósito?

F0NF1MF0F1D=supx|F0(x)F1(x)|D

(Leí en otra parte que la prueba de Kolmogorov-Smirnov para la bondad de ajuste no es válida para distribuciones discretas , pero admito que no entiendo lo que esto significa o por qué podría ser cierto. ¿Eso significa que mi enfoque propuesto es malo? )

O, ¿recomienda algo más en su lugar?

DW
fuente
Me pregunto si, según los comentarios de @ Glen_b aquí ( stats.stackexchange.com/questions/362/… ), uno no debería usar la prueba KS para comparar distribuciones empíricas porque la prueba KS no debería usarse cuando se estiman los parámetros (? )
russellpierce

Respuestas:

19

Eso está bien y es bastante razonable. Se conoce como la prueba de Kolmogorov-Smirnov de dos muestras . Medir la diferencia entre dos funciones de distribución por el supnorm siempre es sensato, pero para hacer una prueba formal, desea conocer la distribución bajo la hipótesis de que las dos muestras son independientes y cada una de ellas es de la misma distribución subyacente. Para confiar en la teoría asintótica habitual, necesitará la continuidad de la distribución común subyacente (no de las distribuciones empíricas). Vea la página de Wikipedia vinculada a arriba para más detalles.

ks.testp

NRH
fuente
8
En R también puede hacer una prueba KS de arranque sekhon.berkeley.edu/matching/ks.boot.html que elimina el requisito de continuidad
Dr G
55
más información si utiliza Matlab
Artem Kaznatcheev