Relación empírica entre media, mediana y moda.

40

Para una distribución unimodal que es moderadamente sesgada, tenemos la siguiente relación empírica entre la media, la mediana y la moda: ¿Cómo fue esta relación? ¿derivado?

(Media - Modo)3(Mediana Media)

¿Karl Pearson trazó miles de estas relaciones antes de llegar a esta conclusión, o hay una línea lógica de razonamiento detrás de esta relación?

Sara
fuente

Respuestas:

29

Denote la media ( promedio), m la mediana, σ la desviación estándar y M el modo. Finalmente, dejemos que X sea ​​la muestra, una realización de una distribución unimodal continua F para la cual existen los dos primeros momentos.μmetroσMETROXF

Es bien sabido que

(1)El |μ-metroEl |σ

Este es un ejercicio frecuente de libros de texto:

La primera igualdad deriva de la definición de la media, la tercera se produce porque la mediana es el minimizador único (entre todas lasc's) deE| X-c| y el cuarto de la desigualdad de Jensen (es decir, la definición de una función convexa). En realidad, esta desigualdad puede hacerse más estricta. De hecho, para cualquierF, que cumpla las condiciones anteriores, se puede demostrar [3] que

|μm|=|E(Xm)|E|Xm|E|Xμ|=E(Xμ)2E(Xμ)2=σ
cE|Xc|F

(2)|mμ|0.6σ

Aunque, en general, no es cierto ( Abadir, 2005 ) que cualquier distribución unimodal debe satisfacer una de , todavía se puede demostrar que la desigualdad

Mmμ or Mmμ

(3)|μM|3σ

se cumple para cualquier distribución integrable cuadrada unimodal (independientemente de la inclinación). Esto se prueba formalmente en Johnson y Rogers (1951) aunque la prueba depende de muchos lemas auxiliares que son difíciles de encajar aquí. Ve a ver el artículo original.


En [2] se da una condición suficiente para que una distribución satisfaga μ m M. Si F :FμmMF

(4)F(mx)+F(m+x)1 for all x

entonces . Además, si μ m , entonces la desigualdad es estricta. Las distribuciones de Pearson Tipo I a XII son un ejemplo de familia de distribuciones que satisfacen ( 4 ) [4] (por ejemplo, Weibull es una distribución común para la cual ( 4 ) no se cumple, ver [5]).μmMμm(4)(4)

Ahora suponiendo que cumple estrictamente y wlog que σ = 1 , tenemos que 3 ( m - μ ) ( 0 , 3 (4)σ=1

3(mμ)(0,30.6] and Mμ(mμ,3]

y dado que el segundo de estos dos rangos no está vacío, ciertamente es posible encontrar distribuciones para las cuales la afirmación es verdadera (por ejemplo, cuando ) para algún rango de valores de los parámetros de la distribución, pero no es cierto para todas las distribuciones y ni siquiera para todas las distribuciones que satisfacen(4).0<mμ<33<σ=1(4 4)

  • [0]: El problema del momento para distribuciones unimodales. NL Johnson y CA Rogers. Los Anales de Estadística Matemática, vol. 22, núm. 3 (septiembre de 1951), págs. 433-439
  • [1]: La desigualdad del modo medio-medio: contraejemplos Karim M. Abadir Econometric Theory, vol. 21, núm. 2 (abril de 2005), págs. 477-482
  • [2]: WR van Zwet, media, mediana, modo II, estadista. Neerlandica, 33 (1979), págs. 1-5.
  • [3]: La media, la mediana y el modo de las distribuciones unimodales: una caracterización. S. Basu y A. DasGupta (1997). Teoría Probab. Appl., 41 (2), 210–223.
  • [4]: Algunas observaciones sobre la media, la mediana, la moda y la inclinación. Michikazu Sato. Revista Australiana de Estadística. Volumen 39, Número 2, páginas 219–224, junio de 1997
  • [5]: PT von Hippel (2005). Mean, Median, and Skew: Correcting a Textbook Rule. Revista de Educación Estadística Volumen 13, Número 2.
usuario603
fuente
Lo siento, solo soy un estudiante de primer año de matemáticas. ¿Podría proporcionar / recomendar un enlace / libro / documento que describa cómo se derivó la relación?
Sara
3
@Sara Creo que se remonta a Karl Pearson, que utiliza esta relación empírica para su "asimetría del modo Pearson". Aparte de esto, puede encontrar interesante este artículo en línea, j.mp/aWymCv .
chl
Gracias chl y kwak por el enlace y la respuesta que ha proporcionado. Los estudiaré.
Sara
2
E|Xk|kX
1
|Mμ|3|μm|
9

El documento chl apunta a da información importante, mostrando que no está cerca de una regla general (incluso para variables continuas, suaves y de "buen comportamiento", como el Weibull). Entonces, aunque a menudo puede ser aproximadamente cierto, con frecuencia no lo es.

Entonces, ¿de dónde viene Pearson? ¿Cómo llegó a esta aproximación?

Afortunadamente, Pearson nos dice la respuesta.

El primer uso del término "sesgo" en el sentido que lo estamos usando parece ser Pearson, 1895 [1] (aparece justo en el título). Este artículo también parece ser donde introduce el término modo (nota al pie, p345):

He encontrado conveniente usar el término modo para la abscisa correspondiente a la ordenada de frecuencia máxima. La "media", el "modo" y la "mediana" tienen todos los caracteres distintos importantes para el estadístico.

También parece ser su primer detalle real de su sistema de curvas de frecuencia .

Entonces, al analizar la estimación del parámetro de forma en la distribución Pearson Tipo III (lo que ahora llamaríamos una gamma desplazada, y posiblemente volteada), dice (p375):

p

>1

x

Y, de hecho, si observamos la relación de (modo medio) a (promedio medio) para la distribución gamma, observamos esto:

ingrese la descripción de la imagen aquí

(La parte azul marca la región en la que Pearson dice que la aproximación es razonable).

αβ

ingrese la descripción de la imagen aquí

βα=kβααβααββ+α=cβ+ααβ

α>10

ingrese la descripción de la imagen aquí

eμσ2,eμeμ+σ2/2

eμeσ2/2eσ2eσ2/21σ232σ212σ2σ2

Hay una buena cantidad de distribuciones bien conocidas, varias de las cuales Pearson conocía, para las cuales es casi cierto para una amplia gama de valores de parámetros; lo notó con la distribución gamma, pero se le habría confirmado la idea cuando mirara otras distribuciones que probablemente consideraría.

[1]: Pearson, K. (1895),
"Contribuciones a la teoría matemática de la evolución, II: variación oblicua en material homogéneo",
Transacciones filosóficas de la Royal Society, Serie A, 186, 343-414
[Sin derechos de autor. Disponible gratuitamente aquí ]

Glen_b -Reinstate a Monica
fuente
4

Esta relación no se derivó. Se observó que mantenía aproximadamente distribuciones casi simétricas empíricamente . Ver la exposición de Yule en La Introducción a la teoría de la estadística , (1922), p. 121, Capítulo VII, Sección 20. Presenta el ejemplo empírico.

Aksakal
fuente
+1 De hecho, mi cita de Pearson 1895 indica que es algo que notó en lugar de derivar.
Glen_b -Reinstate Monica
2
Los textos matemáticos antiguos son mucho más divertidos de leer que los escritos de hoy
Aksakal