Dados los valores de muestra de N, ¿qué significa el "p-ésimo cuantil de los valores de muestra"?
En teoría (con ) significa el punto una fracción arriba de la distribución acumulativa. En la práctica, se utilizan varias definiciones, particularmente en informática estadística. Por ejemplo, en R hay nueve definiciones diferentes , las tres primeras para una interpretación discreta y el resto para una variedad de interpolaciones continuas.p
Aquí hay un ejemplo: si su muestra es {400, 1, 1000, 40}, y está buscando el cuantil 0.6 (percentil 60), entonces los diferentes métodos de cálculo dan
> for (t in 1:9) { x[t] <- quantile(c(400, 1, 1000, 40), probs=0.6, type = t ) }
> x
60%
400 400 40 184 364 400 328 376 373
Mi opinión personal es que la cifra correcta es que 400 es correcta ya que Esto proviene de tratar la muestra como la población, y si se extrae el CDF empírico, será una secuencia de pasos. Existen argumentos opuestos para interpolar, por lo que el CDF empírico es continuo, ya que es probable que sea una aproximación mejor o más útil para la población, y el método de interpolación afectará el resultado.