Estoy tratando de dar el salto desde la idea de un percentil, por ejemplo, sobre la recta numérica real (donde el enésimo percentil es simplemente la posición en la que n% de los puntos de datos están por debajo de él, y 100-n% están por encima de él ), a la idea del área bajo una función de densidad de probabilidad.
Si quiero saber el percentil 50% de un conjunto de números, encontraré el punto en el que la mitad de los números están debajo, la mitad de los números están arriba. Ese es el percentil 50%, y ya terminé.
Si quiero saber el percentil 50% de una distribución, digamos, un puntaje Z, evaluaré el cdf de 0 a 50, y listo. ¿Estoy diciendo esto correcto?
Esto se siente intuitivamente, pero necesito un poco de discusión para ponerlo a punto. O podría estar completamente fuera ...
fuente
No. Esencialmente, calcular un percentil (o un p-cuantil) es equivalente a encontrar el inverso de un CDF.
Tenga en cuenta que la inversa, en el sentido habitual, de un CDF puede no existir y se debe introducir la noción de inversa generalizada. Para que la discusión sea precisa, aclaramos todas las definiciones.
Definición: Un CDF es una función que cumple las siguientes condiciones:F:[−∞,∞]→[0,1]
(En aumento) Para cualquier , si , entonces ,x,y∈[−∞,∞] x<y F(x)≤F(y)
(Continuidad derecha) Para cualquier , tenemos que ,a∈R F(a)=limx→a+F(x)
Tenemos al menos dos versiones de inverso generalizado de , denotado por e , que se definen de la siguiente manera.F Inv1F Inv2F
Aquí, adoptamos la convención que .inf(∅)=∞
Si no recuerdo mal, dado , el -quantile se define simplemente como .p∈[0,1] p Inv1F(p)
Por supuesto, si es estrictamente creciente y continuo, ambas versiones de inverso generalizado son iguales y se reducen al inverso habitual de la funciónF F−1:[0,1]→[−∞,∞].
Para más información: https://people.math.ethz.ch/~embrecht/ftp/generalized_inverse.pdf
fuente