¿Existe una alternativa a la prueba de Kolmogorov-Smirnov para datos vinculados con corrección?

14

Tengo un montón de datos de dos muestras (control y tratamiento), cada una con varios miles de valores que se someterán a pruebas de significación en R. Teóricamente, los valores deberían ser continuos, pero debido al redondeo realizado por el software de medición no son t y tienen lazos. Las distribuciones son desconocidas y las formas de control y distribuciones tratadas pueden ser diferentes, por lo que me gustaría utilizar una prueba no paramétrica para comparar si la diferencia entre las muestras es significativa para 10 factores diferentes.

Pensé en usar la prueba de Kolmogorov-Smirnov, pero en realidad no es adecuada para lazos. Recientemente me topé con una nueva biblioteca R llamada Matching que ejecuta una versión de arranque de la prueba KS y tolera los lazos. ¿Es realmente una buena idea o debería usar otra prueba? ¿Y necesito ajustar el valor p?

AnjaM
fuente
El documento vinculado trata sobre la coincidencia de puntaje de propensión Puede ser que la prueba de arranque tenga más generalidad, pero no estoy seguro.
Michael R. Chernick
Hubiera hecho una versión de aleatorización de algo como el Kolmogorov-Smirnov (bueno, en realidad, probablemente habría usado Anderson-Darling o Cramer-von Mises para el KS, pero aún con la distribución de aleatorización para cuidar de lazos).
Glen_b -Reinstate Monica
¿Has visto el código de Tom Waterhouse ?
Ray Koopman el

Respuestas:

13

En lugar de usar la prueba KS, simplemente puede usar un procedimiento de permutación o remuestreo como se implementa en la oneway_testfunción del coinpaquete. Eche un vistazo a la respuesta aceptada a esta pregunta .

Actualización : Mi paquete afexcontiene la función que compare.2.vectorsimplementa una permutación y otras pruebas para dos vectores. Puede obtenerlo de CRAN:

install.packages("afex")

Para dos vectores xy y(actualmente) devuelve algo como:

> compare.2.vectors(x,y)
$parametric
   test test.statistic test.value test.df       p
1     t              t     -1.861   18.00 0.07919
2 Welch              t     -1.861   17.78 0.07939

$nonparametric
             test test.statistic test.value test.df       p
1 stats::Wilcoxon              W     25.500      NA 0.06933
2     permutation              Z     -1.751      NA 0.08154
3  coin::Wilcoxon              Z     -1.854      NA 0.06487
4          median              Z      1.744      NA 0.17867

Cualquier comentario sobre esta función es muy bienvenido.

Henrik
fuente
3
(+1) Se puede encontrar una descripción de esta y otras pruebas en este blog
@Henrik Gracias por la sugerencia y por señalar la otra pregunta. Eso es realmente útil!
AnjaM
@ AnjaM De nada. También puede consultar mi actualización.
Henrik