Denote la media ( ≠ promedio), m la mediana, σ la desviación estándar y M el modo. Finalmente, dejemos que X sea la muestra, una realización de una distribución unimodal continua F para la cual existen los dos primeros momentos.μ≠mσMXF
Es bien sabido que
|μ−m|≤σ(1)
Este es un ejercicio frecuente de libros de texto:
La primera igualdad deriva de la definición de la media, la tercera se produce porque la mediana es el minimizador único (entre todas lasc's) deE| X-c| y el cuarto de la desigualdad de Jensen (es decir, la definición de una función convexa). En realidad, esta desigualdad puede hacerse más estricta. De hecho, para cualquierF, que cumpla las condiciones anteriores, se puede demostrar [3] que
|μ−m|=≤≤=≤=|E(X−m)|E|X−m|E|X−μ|E(X−μ)2−−−−−−−√E(X−μ)2−−−−−−−−−√σ
cE|X−c|F
|m−μ|≤0.6−−−√σ(2)
Aunque, en general, no es cierto ( Abadir, 2005 ) que cualquier distribución unimodal debe satisfacer una de
, todavía se puede demostrar que la desigualdad
M≤m≤μ or M≥m≥μ
|μ−M|≤3–√σ(3)
se cumple para cualquier distribución integrable cuadrada unimodal (independientemente de la inclinación). Esto se prueba formalmente en Johnson y Rogers (1951) aunque la prueba depende de muchos lemas auxiliares que son difíciles de encajar aquí. Ve a ver el artículo original.
En [2] se da una condición suficiente para que una distribución satisfaga μ ≤ m ≤ M. Si F :Fμ≤m≤MF
F(m−x)+F(m+x)≥1 for all x(4)
entonces . Además, si μ ≠ m , entonces la desigualdad es estricta. Las distribuciones de Pearson Tipo I a XII son un ejemplo de familia de distribuciones que satisfacen ( 4 ) [4] (por ejemplo, Weibull es una distribución común para la cual ( 4 ) no se cumple, ver [5]).μ≤m≤Mμ≠m(4)(4)
Ahora suponiendo que cumple estrictamente y wlog que σ = 1 , tenemos que
3 ( m - μ ) ∈ ( 0 , 3 √(4)σ=1
3(m−μ)∈(0,30.6−−−√] and M−μ∈(m−μ,3–√]
y dado que el segundo de estos dos rangos no está vacío, ciertamente es posible encontrar distribuciones para las cuales la afirmación es verdadera (por ejemplo, cuando ) para algún rango de valores de los parámetros de la distribución, pero no es cierto para todas las distribuciones y ni siquiera para todas las distribuciones que satisfacen(4).0<m−μ<3√3<σ=1( 4 )
- [0]: El problema del momento para distribuciones unimodales. NL Johnson y CA Rogers. Los Anales de Estadística Matemática, vol. 22, núm. 3 (septiembre de 1951), págs. 433-439
- [1]: La desigualdad del modo medio-medio: contraejemplos Karim M. Abadir Econometric Theory, vol. 21, núm. 2 (abril de 2005), págs. 477-482
- [2]: WR van Zwet, media, mediana, modo II, estadista. Neerlandica, 33 (1979), págs. 1-5.
- [3]: La media, la mediana y el modo de las distribuciones unimodales: una caracterización. S. Basu y A. DasGupta (1997). Teoría Probab. Appl., 41 (2), 210–223.
- [4]: Algunas observaciones sobre la media, la mediana, la moda y la inclinación. Michikazu Sato. Revista Australiana de Estadística. Volumen 39, Número 2, páginas 219–224, junio de 1997
- [5]: PT von Hippel (2005). Mean, Median, and Skew: Correcting a Textbook Rule. Revista de Educación Estadística Volumen 13, Número 2.
El documento chl apunta a da información importante, mostrando que no está cerca de una regla general (incluso para variables continuas, suaves y de "buen comportamiento", como el Weibull). Entonces, aunque a menudo puede ser aproximadamente cierto, con frecuencia no lo es.
Entonces, ¿de dónde viene Pearson? ¿Cómo llegó a esta aproximación?
Afortunadamente, Pearson nos dice la respuesta.
El primer uso del término "sesgo" en el sentido que lo estamos usando parece ser Pearson, 1895 [1] (aparece justo en el título). Este artículo también parece ser donde introduce el término modo (nota al pie, p345):
También parece ser su primer detalle real de su sistema de curvas de frecuencia .
Entonces, al analizar la estimación del parámetro de forma en la distribución Pearson Tipo III (lo que ahora llamaríamos una gamma desplazada, y posiblemente volteada), dice (p375):
Y, de hecho, si observamos la relación de (modo medio) a (promedio medio) para la distribución gamma, observamos esto:
(La parte azul marca la región en la que Pearson dice que la aproximación es razonable).
Hay una buena cantidad de distribuciones bien conocidas, varias de las cuales Pearson conocía, para las cuales es casi cierto para una amplia gama de valores de parámetros; lo notó con la distribución gamma, pero se le habría confirmado la idea cuando mirara otras distribuciones que probablemente consideraría.
[1]: Pearson, K. (1895),
"Contribuciones a la teoría matemática de la evolución, II: variación oblicua en material homogéneo",
Transacciones filosóficas de la Royal Society, Serie A, 186, 343-414
[Sin derechos de autor. Disponible gratuitamente aquí ]
fuente
Esta relación no se derivó. Se observó que mantenía aproximadamente distribuciones casi simétricas empíricamente . Ver la exposición de Yule en La Introducción a la teoría de la estadística , (1922), p. 121, Capítulo VII, Sección 20. Presenta el ejemplo empírico.
fuente