En los datos sesgados a la izquierda, ¿cuál es la relación entre la media y la mediana?

12

Creo que la mediana media.

¿Es este el caso?

Kunjan Kshetri
fuente
2
¿Qué curso MOOC abierto es ese? ¿Qué sugieren los materiales del curso que debería ser la respuesta?
Glen_b -Reinstalar Monica
1
class.stanford.edu/courses/Medicine/HRP258/… . El curso ha terminado.
Kunjan Kshetri
1
Gracias, al menos eso es algo de contexto, aunque todo lo que queda son lecturas semanales que no arrojan mucha luz sobre este tema. Me pregunto qué dijo el curso sobre el tema.
Glen_b -Reinstalar Monica

Respuestas:

16

Es una pregunta no trivial (seguramente no es tan trivial como parece pensar la gente que hace la pregunta).

En última instancia, la dificultad es causada por el hecho de que realmente no sabemos qué queremos decir con 'asimetría'; muchas veces es algo obvio, pero a veces realmente no lo es. Dada la dificultad de precisar lo que queremos decir con 'ubicación' y 'propagación' en casos no triviales (por ejemplo, la media no siempre es lo que queremos decir cuando hablamos de ubicación), no debería ser una gran sorpresa que una respuesta más sutil concepto como asimetría es al menos tan resbaladizo. Esto nos lleva a probar varias definiciones algebraicas de lo que queremos decir, y no siempre están de acuerdo entre sí.

1) Si mide la asimetría por el segundo coeficiente de asimetría de Pearson , entonces la media ( ) será menor que la mediana ( μ , es decir, en este caso la tiene al revés).μ

La segunda asimetría de Pearson (población) es y será negativo ("sesgo izquierdo") cuando μ < μ

3(μ-μ)σ,
μ<μ .

Las versiones de muestra de estas estadísticas funcionan de manera similar.

La razón de la relación necesaria entre la media y la mediana en este caso es porque así es como se define la medida de asimetría.

Aquí hay una densidad sesgada a la izquierda (tanto por la segunda medida de Pearson como por la medida más común en (2) a continuación):

ingrese la descripción de la imagen aquí

La mediana está marcada en el margen inferior en verde, la media en rojo.

Así que espero la respuesta que quieren que des. es que la media es menor que la mediana. Suele ser el caso con los tipos de distribuciones a las que solemos dar nombres.

(Pero siga leyendo y vea por qué eso no es realmente correcto como una declaración general).


2) Si lo mide por el tercer momento estandarizado más habitual , a menudo es, pero no siempre, el caso de que la media sea menor que la mediana.

Es decir, es posible construir ejemplos donde lo opuesto es cierto, o donde una medida de asimetría es cero mientras que la otra no es cero.

Es decir, no hay necesidad relación entre las ubicaciones de la media, la mediana y la asimetría del momento.

Considere, por ejemplo, la siguiente muestra (el mismo ejemplo puede construirse como una distribución de probabilidad discreta):

  2.7 15.0 15.0 15.0 30.0 30.0

mean: 17.95
median: 15

Sin embargo, el coeficiente de asimetría (Fisher, tercer momento) es negativo (es decir, por sus luces, tenemos datos de asimetría hacia la izquierda) ya que la suma de los cubos de las desviaciones de la media es negativa.

Entonces, en ese caso, sesgo a la izquierda, pero significa> mediana.

(Por otro lado, si cambia 2.7 en el ejemplo anterior a 3, entonces tiene un ejemplo donde la asimetría de momento es cero, pero la media excede la mediana. Si lo hace 3.3, entonces la asimetría de momento es positiva , y la media excede la mediana, es decir, finalmente está en la dirección 'anticipada').

Si usa el primer sesgo de Pearson en lugar de cualquiera de las definiciones anteriores, tiene un problema similar a este caso: la dirección del sesgo no determina la relación entre la media y la mediana en general.


Editar: en respuesta a una pregunta en los comentarios, un ejemplo en el que la media y la mediana son iguales, pero la asimetría del momento es negativa. Considere los siguientes datos (como antes, también cuenta como un ejemplo para una población discreta; considere escribir los números en las caras de un dado).

 1  5  6  6  8 10

la media y la mediana son ambas 6, pero la suma de cubos de desviaciones de la media es negativa, por lo que la asimetría del tercer momento es negativa.

Glen_b -Reinstate a Monica
fuente
1
@ Peter Perdón por la lenta respuesta, estaba ocupado construyendo esos ejemplos y no vi tu pregunta.
Glen_b -Reinstalar Monica
2
He visto muchas definiciones de libros de texto y ninguna mencionó esto. Frio.
Peter Flom - Restablece a Monica
66
@ Peter Desafortunadamente, muchos libros de texto de primaria simplemente repiten información incorrecta de otros libros de texto sin hacer una investigación real por sí mismos, por lo que se propaga un concepto erróneo básico. Los contraejemplos son, como puede ver, relativamente fáciles de construir (solo los hago a mano según sea necesario). Kendall y Stuart ( Teoría avanzada de estadística, Vol. I - no dejes que el título te desanime, es bastante legible), al menos las ediciones tercera y cuarta, tienen buena información. Las ediciones más recientes son de Stuart y Ord. De hecho, he publicado sobre este tema en CV varias veces.
Glen_b -Reinstalar a Monica
44
(5 5k)0.8k0.2 0.25 5-k(5 5k)0.2 0.2k0.85 5-k=
1
@ Nick Sí, los binomios con media entera son excelentes ejemplos.
Glen_b -Reinstalar Monica
5

No. Los datos sesgados a la izquierda tienen una cola larga a la izquierda (extremo bajo), por lo que la media generalmente será menor que la mediana. (Pero vea la respuesta de @Glen_b para una excepción). Casualmente, creo que los datos que "parecen" sesgados tendrán un significado menor que la mediana.

Los datos sesgados a la derecha son más comunes; por ejemplo, ingresos. Allí la media es mayor que la mediana.

Código R

set.seed(123)  #set random seed
normdata <- rnorm(1000) #Normal data, skew = 0
extleft <- c(rep(-10, 5), rep(-20, 5)) #Some data to make skew left
alldata <- c(normdata,extleft)

library(moments)
skewness(alldata) #-6.77
mean(alldata) #-0.13
median(alldata) #-0.001
Peter Flom - Restablece a Monica
fuente
¿Puede la media ser igual a la mediana?
Kunjan Kshetri
unj2 Agregué un ejemplo a mi respuesta donde la asimetría del tercer momento es negativa pero media = mediana.
Glen_b -Reinstalar Monica