Si define como la versión ordenada de sus datos originales , entonces la mediana se define como:O1,O2,…,ONX1,X2,…,XN
Median({O1,O2,…,ON})={O(N+1)/2(ON/2+ON/2+1)/2if N is oddotherwise
Sin ordenar sus datos, puede usar la definición de la mediana geométrica para definir la mediana en una dimensión:
Median({X1,X2,…,XN})=argminy∑i=1N∣∣Xi−y∣∣
Tenga en cuenta que esto no necesariamente define una mediana única cuando hay un número par de puntos; por ejemplo, cualquier número optimiza el objetivo con .y∈[3,4]X={2,3,4,5}
Una forma alternativa de expresar la media es la estimación de "mínimos cuadrados":
Elegir como la media da el valor más pequeño de la suma de los errores al cuadrado.m
Ahora la mediana se puede expresar como la estimación de "desviaciones menos absolutas":
Elegir para ser la mediana da el valor más pequeño de la suma de los errores absolutos.m
fuente
La mediana es el valor correspondiente al medio cuantil, es decir, la mitad de los valores son más altos, la mitad son más bajos (perdón por ignorar casos con igualdad o cuando el conjunto es par ...). De modo que dado que se el pdf del conjunto de datos , la distribución acumulativa se evalúa fácilmente. Observando esta función, luegopX X1⋅Xn PX
Tomemos, por ejemplo, el caso de los ángulos en este método utilizado en este documento de revisión para la ecualización del histograma. El panel inferior izquierdo muestra el pdf de los ángulos en un conjunto de imágenes naturales. es la distribución acumulativa y la mediana es el valor de correspondiente al valor , que es aproximadamente en ese caso.p(θ) P(θ) θ 1/2 0
fuente