Voy a usar la prueba de Kolmogorov-Smirnov para evaluar la normalidad de MYDATA en R. Este es un ejemplo de lo que hago
ks.test(MYDATA,"pnorm",mean(MYDATA),sd(MYDATA))
Aquí está el resultado que me da R:
data: MYDATA
D = 0.13527, p-value = 0.1721
alternative hypothesis: two-sided
Warning message:
In ks.test(MYDATA, "pnorm", mean(MYDATA), sd(MYDATA)) :
ties should not be present for the Kolmogorov-Smirnov test
Creo que hay un problema, ¿qué significa "lazos" en esta advertencia?
kolmogorov-smirnov
ties
unes
fuente
fuente
Respuestas:
Tienes dos problemas aquí:
La prueba KS es para una distribución continua, por lo que MYDATA no debe contener ningún vínculo (valores repetidos).
La teoría subyacente a la prueba KS no le permite estimar los parámetros de la distribución a partir de los datos como lo ha hecho. La ayuda para ks.test explica esto.
fuente
ks.test
en un caso de dos muestras quiere que se eliminen los lazos de ambosx
yy
? Quiero decir, no tengo vínculos enx
yy
(unique(x)
yunique(y)
), pero los dos vectores tienen un valor en común. ¿No deberían considerarse los lazos solo entre los valores inx
y iny
?Como explicó @mdewey, la prueba KS no es adecuada al estimar los parámetros a partir de los datos. Puede usar el siguiente código, que se basa en la prueba de normalidad Anderson-Darling y no requiere que proporcione la media y el estándar. Esta prueba es más fuerte en precisión que la prueba de Lilliefors.
fuente