¿Cómo se relaciona el valor esperado con la media, la mediana, etc. en una distribución no normal?

9

¿Cómo se relaciona el valor esperado de una variable aleatoria continua con su media aritmética, mediana, etc. en una distribución no normal (p. Ej., Skew-normal)? Estoy interesado en cualquier distribución común / interesante (por ejemplo, log-normal, distribuciones bi / multimodales simples, cualquier otra cosa extraña y maravillosa).

Estoy buscando principalmente respuestas cualitativas, pero cualquier respuesta cuantitativa o formulada también es bienvenida. En particular, me gustaría ver cualquier representación visual que lo haga más claro.

nada101
fuente
¿Puedes ser un poco más claro? La media aritmética y la mediana son funciones que aplicamos a los datos, no nada intrínseco a distribuciones particulares ... por ejemplo, los datos no tienen que ser normales para que pueda calcular la media de la muestra.
invitado
Ok, entonces la pregunta debería ser técnicamente "¿cómo se relaciona el valor esperado con la media, mediana, etc. de datos extraídos al azar de una distribución de probabilidad particular?" Estoy buscando comprensiones simples e intuitivas, similares a la forma en que puede decir intuitivamente que cuando una distribución está más sesgada, la mediana y la media están más separadas, y la mediana puede dar una mejor indicación de dónde se encuentran los datos.
nada101
Je Gracias Marco. Claramente he estado leyendo cosas mal. Bien podría escribir eso como respuesta, lo elegiré con la mejor respuesta.
naught101

Respuestas:

8

(parcialmente convertido de mi comentario ahora eliminado arriba)

El valor esperado y la media aritmética son exactamente lo mismo. La mediana está relacionada con la media de una manera no trivial, pero puede decir algunas cosas sobre su relación:

  • cuando una distribución es simétrica, la media y la mediana son iguales

  • cuando una distribución está sesgada negativamente, la mediana suele ser mayor que la media

  • cuando una distribución está sesgada positivamente, la mediana suele ser menor que la media

Macro
fuente
Interesante. ¿Qué ejemplos hay del comportamiento inusual de una distribución sesgada negativamente donde la media es mayor que la mediana?
naught101
@ naught101: ¿es esto un error tipográfico? Una distribución sesgada negativamente es aquella en la que los resultados del centro izquierda ocurren con mayor frecuencia que los resultados del centro derecha y, por lo tanto, la "cola" de los resultados de baja frecuencia sale a la derecha. En tal situación, la joroba de la izquierda siempre tirará de la media (aritmética) a la izquierda del centro, mientras que la cola de la derecha mantendrá la mediana mayor que la media.
Assad Ebrahim
@AssadEbrahim: No, fue una referencia al comentario de Macro "la mediana suele ser mayor que la media" . Estaba pidiendo ejemplos contrarios.
naught101
@ naught101: Los contraejemplos en el caso de una distribución unimodal son su siguiente línea: cuando la joroba está a la derecha, la cola a la izquierda tira de la mediana por debajo de la media. Cuanto más larga es la cola, mayor es la brecha entre la mediana y la media.
Assad Ebrahim
1
¿Cuáles son las circunstancias prácticas en las que uno usaría una mediana sobre una media o viceversa? Por ejemplo, en el análisis de supervivencia donde las vidas siguen una distribución exponencial, ¿debo usar la mediana (para que la mitad dure más, la mitad dure menos) o la media (la vida "esperada") si tuviera que predecir la vida / muerte como un binario ¿Salir?
drevicko
5

Existe una buena relación entre la media armónica, geométrica y aritmética de una variable aleatoria de distribución logarítmica normal . DejarXLN(μ,σ2)

  • (media armónica),HM(X)=eμ12σ2
  • (media geométrica),GM(X)=eμ
  • (media aritmética).UNAMETRO(X)=miμ+12σ2

No es difícil ver que el producto de la media armónica y aritmética produce el cuadrado de la media geométrica, es decir

HMETRO(X)UNAMETRO(X)=solMETRO2(X).

XXX

solMETRO(X)=HMETRO(X)UNAMETRO(X).

Además, la conocida desigualdad HM-GM-AM

HMETRO(X)solMETRO(X)UNAMETRO(X)

puede expresarse como

HMETRO(X)solVunar(X)=solMETRO(X)=UNAMETRO(X)solVunar(X),

solVunar(X)=miσ2

Björn Friedrich
fuente
1

Para completar, también hay distribuciones para las cuales la media no está bien definida. Un ejemplo clásico es la distribución de Cauchy ( esta respuesta tiene una buena explicación de por qué). Otro ejemplo importante es la distribución de Pareto con exponente menor que 2.

drevicko
fuente
1
X=0 0
@Carl buenos puntos: edité la respuesta en consecuencia. Muchas gracias (:
drevicko
0

Si bien es correcto que la media matemática y el valor esperado se definan de manera idéntica, para una distribución sesgada, esta convención de nomenclatura se vuelve engañosa.

Imagina que le preguntas a una amiga sobre los precios de la vivienda en su ciudad porque realmente te gusta y piensas en mudarte a esa ciudad.

Si la distribución de los premios de vivienda fue unimodal y simétrica, entonces su amigo puede decirle el precio promedio de las casas y, de hecho, puede esperar encontrar la mayoría de las casas en el mercado alrededor de ese valor promedio .

Sin embargo, si la distribución de los precios de la vivienda es unimodal y sesgada, por ejemplo, con la mayoría de las casas en el rango de precios más bajo a la izquierda y solo algunas casas exorbitantes a la derecha, entonces la media estará "sesgada" a precios altos en la derecha.

Para esta distribución unimodal y sesgada del precio de la vivienda, puede esperar encontrar la mayoría de las casas en el mercado alrededor de la mediana .

Sol Hator
fuente
1
No está claro a qué se refiere cuando dice que para distribuciones unimodales sesgadas, la distribución del precio de la vivienda tiene precios alrededor de la mediana. Lo que se puede decir es que la mitad de los valores será igual o inferior a la mediana y la mitad será igual o superior a la mediana. No indica qué tan cerca están estos valores de la media.
Michael R. Chernick
¿Supongo que se supone que tu última oración termine con "mediana"? Si es así, creo que es obvio que la mediana tiene que ser el valor (alcanzable) más cercano al promedio (que podría no ser alcanzable, por ejemplo, no el precio de la vivienda) de una muestra aleatoria tomada de la población descrita anteriormente. Esa es la mediana más cercana a esa muestra promedio, en promedio. Si no es así, no hice un reclamo sobre qué tan cerca están estos valores de la media. Hice un reclamo sobre su distancia a la mediana.
Sol Hator