Tengo dos muestras que quiero probar (usando python) si se extraen de la misma distribución. Para hacer eso, uso la función estadística ks_2samp de scipy.stats. Devuelve 2 valores y encuentro dificultades para interpretarlos. ¡Ayuda por favor!
Como Stijn señaló, la prueba ks devuelve una estadística D y un valor p correspondiente a la estadística D. La estadística D es la distancia máxima absoluta (supremum) entre los CDF de las dos muestras. Cuanto más cercano esté este número a 0, más probable es que las dos muestras se extraigan de la misma distribución. Echa un vistazo a la página de Wikipedia para la prueba de ks. Proporciona una buena explicación: https://en.m.wikipedia.org/wiki/Kolmogorov%E2%80%93Smirnov_test
El valor p devuelto por la prueba ks tiene la misma interpretación que otros valores p. Rechaza la hipótesis nula de que las dos muestras se extrajeron de la misma distribución si el valor p es menor que su nivel de significancia. Puede encontrar tablas en línea para la conversión de la estadística D en un valor p si está interesado en el procedimiento.
Al hacer una búsqueda en Google de ks_2samp, el primer éxito es este sitio web. En él, puede ver la especificación de la función:
fuente