Expectativa condicional de variables aleatorias uniformes según estadísticas de orden

8

Suponga que X = ~ , donde .(X1,...,Xn)U(θ,2θ)θR+

¿Cómo se calcula la expectativa condicional de E[X1|X(1),X(n)], dónde X(1) y X(n) Cuáles son las estadísticas de pedido más pequeñas y más grandes respectivamente?

Mi primer pensamiento sería que, dado que las estadísticas del pedido limitan el rango, es simplemente (X(1)+X(n))/2, pero no estoy seguro si esto es correcto!

N. Quizitive
fuente
1
Esta publicación sobre matemáticas SE podría ser útil
kjetil b halvorsen

Respuestas:

8

Considere el caso de una muestra iid X1,X2,,Xn de un uniforme(0,1)distribución. Escalando estas variables porθ y traduciéndolos por θ les otorga un uniforme(θ,2θ)distribución. Todo lo relevante para este problema cambia de la misma manera: las estadísticas del pedido y las expectativas condicionales. Por lo tanto, la respuesta obtenida en este caso especial se mantendrá en general.

Dejar 1<k<n. Al emular el razonamiento en https://stats.stackexchange.com/a/225990/919 (o en otro lugar), descubra que la distribución conjunta de(X(1),X(k),X(n)) tiene función de densidad

fk;n(x,y,z)=I(0xyz1)(yx)k2(zy)nk1.

Fijación (x,z) y viendo esto en función de y, esto es reconocible como Beta(k1,nk) distribución que se ha escalado y traducido al intervalo [x,z]. Por lo tanto, el factor de escala debe ser zx y la traducción toma 0 a x.

Desde la expectativa de una Beta(k1,nk)la distribución es(k1)/(n1), encontramos que la expectativa condicional de X(k)debe ser la expectativa traducida y escalada; a saber,

E(X(k)X(1),X(n))=X(1)+(X(n)X(1))k1n1.

Los casos k=1 y k=n son triviales: sus expectativas condicionales son, respectivamente, X(1) y X(k).

Encontremos la expectativa de la suma de todas las estadísticas de pedidos:

E(k=1nX(k))=X(1)+k=2n1(X(1)+(X(n)X(1))k1n1)+X(n).

El álgebra se reduce a obtener la suma.

k=2n1(k1)=(n1)(n2)/2.

Así

E(k=1nX(k))=(n1)X(1)+(X(n)X(1))(n1)(n2)2(n1)+X(n)=n2(X(n)+X(1)).

Finalmente, porque el Xi están idénticamente distribuidos, todos tienen la misma expectativa, de donde

nE(X1X(1),X(n))=E(X1)+E(X2)++E(Xn)=E(X(1))+E(X(2))++E(X(n))=n2(X(n)+X(1)),

con la solución única

E(X1X(1),X(n))=(X(n)+X(1))/2.


Merece la pena señalar que este resultado no es una consecuencia única de la simetría de la distribución uniforme: es particular de la familia uniforme de distribuciones. Para cierta intuición, considere los datos extraídos de una Beta(a,a) distribución con a<1. Las probabilidades de esta distribución se concentran cerca 0 y 1(su densidad tiene forma de U o "bañera"). CuandoX(n)<1/2, podemos estar seguros de que la mayoría de los datos se acumulan cerca de X(1) y por lo tanto tenderá a tener expectativas inferiores al punto medio (X(1)+X(n))/2; y cuando X(1)>1/2, the opposite happens and most of the data are likely piled up close to X(n).

whuber
fuente
1

The following is not a proof but a verification of the desired result once you know that (X(1),X(n)) is a complete statistic for θ :

Joint pdf of X1,X2,,Xn is

fθ(x1,,xn)=1θn1θ<x(1),x(n)<2θ=1θn112x(n)<θ<x(1),θR+

So T=(X(1),X(n)) is a sufficient statistic for θ. It can be shown that T is also a complete statistic by proceeding along these lines.

Then by Lehmann-Scheffe theorem, E[X1T] is the UMVUE of E(X1)=3θ2.

Now, 1θ(Xiθ)i.i.dU(0,1), so that 1θ(X(n)θ)Beta(n,1) and 1θ(X(1)θ)Beta(1,n).

Therefore, E(X(n))=nθn+1+θ=(2n+1)θn+1 and E(X(1))=θn+1+θ=(n+2)θn+1.

Hence,

E[12(X(1)+X(n))]=12(n+1)((n+2)θ+(2n+1)θ)=3θ2

This proves that 12(X(1)+X(n)) is the UMVUE of 3θ2 by Lehmann-Scheffe.

Since UMVUE is unique whenever it exists, it verifies the claim that E[X1T]=12(X(1)+X(n)).

StubbornAtom
fuente
+1 This answer is nice because it reveals a deeper way to understand the exercise and what it can teach us.
whuber