La pregunta lo dice todo. He leído que no se puede generalizar KS a una dimensión igual o mayor que dos , y que las implementaciones famosas como esa en Numerical Recipes son simplemente incorrectas. ¿Podría explicar por qué es así?
kolmogorov-smirnov
bivariate
ecdf
pedrofigueira
fuente
fuente
Respuestas:
Creo que es legítimo citar la parte relevante del párrafo en cuestión:
Como se dijo, esto parece demasiado fuerte.
1) La función de distribución bivariada, que es es un mapa de a . Es decir, la función toma valores reales univariantes entre 0 y 1. Esos valores, que son probabilidades, ciertamente ya están "ordenados", y esto (el valor de la función) es lo que necesitamos para hacer comparaciones para pruebas basadas en ECDF . Del mismo modo, el ecdf, está perfectamente bien definido en el caso bivariado.F(x1,x2)=P(X1≤x1,X2≤x2) R2 [0,1] F^
No creo que sea necesariamente necesario tratar de convertirlo en alguna función de una variable combinada univariante como sugiere el texto. Simplemente calcule y en cada combinación requerida y calcule la diferencia.F F^
2) Sin embargo, sobre la cuestión de si está libre de distribución, tienen un punto:
a) claramente, tal estadística de prueba no se vería alterada por cambios en las transformaciones de los márgenes, es decir, si se construye como una prueba de uniformes independientes bivariados, , entonces funciona igualmente así como una prueba de independiente donde . En ese sentido, no tiene distribución (podríamos decir 'sin margen').U=(U1,U2) (X1,X2) Ui=Fi(Xi)
b) sin embargo, hay un punto subyacente más general en el sentido más amplio de que una versión ingenua de la estadística KS (como acabo de describir) no está generalmente más libre de distribución; no podemos simplemente transformar arbitrariamente .U X∗=g(U)
En una versión anterior de mi respuesta dije:
Eso está mal. De hecho, hay problemas si hay un cambio no solo en los márgenes de los uniformes independientes bivariados, como se mencionó anteriormente. Sin embargo, esas dificultades se han considerado de varias maneras en varios documentos que producen versiones bivariadas / multivariadas de las estadísticas de Kolmogorov-Smirnov que no sufren ese problema.
Puedo volver y agregar algunas de esas referencias y una discusión sobre cómo funcionan tan pronto como el tiempo lo permita.
fuente