Valor esperado de la mediana muestral dada la media muestral

16

Deje denotar la mediana y deje que denote la media de una muestra aleatoria de tamaño de una distribución que es N (\ mu, \ sigma ^ 2) . ¿Cómo puedo calcular E (Y | \ bar {X} = \ bar {x}) ?YX¯n=2k+1N(μ,σ2)E(Y|X¯=x¯)

Intuitivamente, debido al supuesto de normalidad, tiene sentido afirmar que E(Y|X¯=x¯)=x¯ y de hecho esa es la respuesta correcta. ¿Puede eso mostrarse rigurosamente?

Mi pensamiento inicial fue abordar este problema utilizando la distribución normal condicional, que generalmente es un resultado conocido. El problema es que, dado que no conozco el valor esperado y, en consecuencia, la varianza de la mediana, tendría que calcular los que usan la estadística de k+1 1er orden. Pero eso es muy complicado y preferiría no ir a menos que sea absolutamente necesario.

JohnK
fuente
2
Creo que esto es una consecuencia inmediata de la generalización que acabo de publicar en stats.stackexchange.com/a/83887 . La distribución de los residuos es claramente simétrica alrededor de , por lo que su mediana tiene una distribución simétrica, por lo que su media es cero. Por lo tanto, la expectativa de la mediana en sí (no solo de los residuos) es igual a , QED. xix¯00+E(X¯ | X¯=x¯)=x¯
whuber
@whuber Lo siento, ¿residuos?
JohnK
Los definí en mi comentario: son las diferencias entre cada y su media. xi
whuber
@whuber No, lo entiendo, pero todavía estoy trabajando para entender cómo su otra respuesta se relaciona con mi pregunta y cómo funciona exactamente la expectativa que ha utilizado.
JohnK
2
@whuber De acuerdo, corrígeme si me equivoco, Y ahora el segundo término es cero porque la mediana es simétrica alrededor de . Por lo tanto, la expectativa se reduce aE(Y|X¯)=E(X¯|X¯)+E(YX¯|X¯)x¯x¯
JohnK

Respuestas:

7

Deje que denote la muestra original y el vector aleatorio con entradas . Entonces está centrado normalmente (pero sus entradas no son independientes, como se puede ver por el hecho de que su suma es cero con toda probabilidad). Como funcional lineal de , el vector de es normal, por lo tanto el cálculo de sus basta matriz de covarianza para mostrar que es independiente de .XZZk=XkX¯ZX(Z,X¯)ZX¯

Volviendo a , se ve que donde es la mediana de . En particular, depende de solo, por lo tanto, es independiente de , y la distribución de es simétrica, por lo tanto, está centrado.YY=X¯+TTZTZTX¯ZT

Finalmente,

E(YX¯)=X¯+E(TX¯)=X¯+E(T)=X¯.
Hizo
fuente
Gracias, esto se hizo hace casi un año y estoy muy contento de que alguien finalmente lo haya aclarado.
JohnK
7

La mediana de la muestra es una estadística de orden y tiene una distribución no normal, por lo que la distribución conjunta de muestras finitas de la mediana de la muestra y la media de la muestra (que tiene una distribución normal) no sería bivariada normal. Recurriendo a aproximaciones, asintóticamente las siguientes reservas (ver mi respuesta aquí ):

n[(X¯nYn)(μv)]LN[(00),Σ]

con

Σ=(σ2E(|Xv|)[2f(v)]1E(|Xv|)[2f(v)]1[2f(v)]2)

donde es la media muestral y la media poblacional, es la mediana muestral y la mediana poblacional, es la densidad de probabilidad de las variables aleatorias involucradas y es la varianza. μYnvf()σ2X¯nμYnvf()σ2

Entonces, aproximadamente para muestras grandes, su distribución conjunta es bivariada normal, por lo que tenemos que

E(YnX¯n=x¯)=v+ρσvσX¯(x¯μ)

donde es el coeficiente de correlación.ρ

Al manipular la distribución asintótica para que se convierta en la distribución conjunta aproximada de la muestra grande de la media y la mediana muestrales (y no de las cantidades estandarizadas), tenemos

ρ=1nE(|Xv|)[2f(v)]11nσ[2f(v)]1=E(|Xv|)σ

Entonces

E(YnX¯n=x¯)=v+E(|Xv|)σ[2f(v)]1σ(x¯μ)

Tenemos que debido a la simetría de la densidad normal, por lo que llegamos a2f(v)=2/σ2π

E(YnX¯n=x¯)=v+π2E(|Xμσ|)(x¯μ)

donde hemos usado . Ahora la variable estandarizada es una normal estándar, por lo que su valor absoluto es una distribución medio normal con un valor esperado igual a (ya que la varianza subyacente es la unidad). Entoncesv=μ2/π

E(YnX¯n=x¯)=v+π22π(x¯μ)=v+x¯μ=x¯
Alecos Papadopoulos
fuente
2
Como siempre, buena respuesta +1. Sin embargo, dado que no tenemos información sobre el tamaño de la muestra, la distribución asintótica podría no mantenerse. Sin embargo, si no hay forma de obtener la distribución exacta, supongo que tendré que arreglármelas. Muchas gracias.
JohnK
6

La respuesta es .x¯

Deje que tenga una distribución multivariada para la cual todos los marginales son simétricos con respecto a un valor común . (No importa si son independientes o incluso si están distribuidas de forma idéntica). Defina como la media aritmética de escriba para el vector de residuos. El supuesto de simetría en implica que la distribución de es simétrica con respecto a ; es decir, cuando es cualquier evento,x=(x1,x2,,xn)Fμx¯xi, x¯=(x1+x2++xn)/nxx¯=(x1x¯,x2x¯,,xnx¯)Fxx¯0ERn

PrF(xx¯E)=PrF(xx¯E).

La aplicación del resultado generalizado en /stats//a/83887 muestra que la mediana de tiene una distribución simétrica de aproximadamente . Suponiendo que exista su expectativa (que ciertamente es el caso cuando las distribuciones marginales de son normales), esa expectativa tiene que ser (porque la simetría implica que es igual a su propia negativa).xx¯0xi0

Ahora, al restar el mismo valor de cada uno de un conjunto de valores no cambia su orden, (la mediana de ) es igual a más la mediana de . En consecuencia, su expectativa condicional en es igual a la expectativa de condicional en , más . El último obviamente es mientras que el primero es porque la expectativa incondicional es . Su suma es QED.x¯Yxix¯xx¯x¯xx¯x¯E(x¯ | x¯)x¯00x¯,

whuber
fuente
Gracias por publicarlo como respuesta completa. Ahora entiendo la esencia de su argumento, pero podría hacerle un ping si algo aún no está claro.
JohnK
55
JohnK, necesito alertarte para que seas cauteloso. Me ha llamado la atención un contraejemplo de este argumento. He alentado a su creador a publicarlo aquí para una discusión adicional, pero brevemente se trata de una distribución bivariada discreta con marginales simétricos pero marginales condicionales asimétricos. Su existencia apunta a una deducción defectuosa al principio de mi argumento. Actualmente espero que el argumento pueda rescatarse imponiendo condiciones más fuertes en el , pero mi atención se centra actualmente en otra parte y es posible que no pueda pensar en esto por un tiempo. xi
whuber
44
Mientras tanto, le animo a que no acepte esta respuesta. Normalmente eliminaría cualquier respuesta mía que se sepa que es incorrecta, pero (como se puede decir) me gustan las soluciones basadas en los primeros principios en lugar de los cálculos detallados, así que espero que este argumento pueda ser rescatado. Por lo tanto, tengo la intención de dejarlo abierto a críticas y mejoras (y por lo tanto lo hice CW); deje que los votos caigan como puedan.
whuber
Por supuesto, gracias por hacérmelo saber. Lo discutiremos más cuando tenga tiempo. Mientras tanto, me conformaré con el argumento asintótico propuesto por @Alecos Papadopoulos.
JohnK
6

Esto es más simple que las respuestas anteriores. La media muestral es una estadística completa y suficiente (cuando se conoce la varianza, pero nuestros resultados no dependen de la varianza, por lo tanto, serán válidos también en la situación en la que se desconoce la varianza). Entonces, Rao-Blackwell junto con los teoremas de Lehmann-Scheffe (ver wikipedia ...) implicarán que la expectativa condicional de la mediana, dada la media aritmética, es el estimador imparcial de varianza mínima única de la expectativa . Pero sabemos que esa es la media aritmética, por lo tanto, el resultado sigue. μ

También utilizamos que la mediana es un estimador imparcial, que se deduce de la simetría.

kjetil b halvorsen
fuente
1
Por simetría , de hecho. Entonces, a partir de estos dos teoremas, sabemos que es el Estimador imparcial de varianza mínima única para que ya sabemos que es igual a . Esta es una respuesta brillante, muchas gracias. Lo habría marcado como el correcto, si no hubiera hecho eso para otra respuesta. E[Y]=μE[Y|X¯]μX¯
JohnK