Valor esperado de la estadística de pedido mínimo de una muestra normal

9

ACTUALIZACIÓN 25 de enero de 2014: el error ahora está corregido. Ignore los valores calculados del valor esperado en la imagen cargada, están equivocados, no elimino la imagen porque ha generado una respuesta a esta pregunta.

ACTUALIZACIÓN 10 de enero de 2014: se encontró el error: un error tipográfico matemático en una de las fuentes utilizadas. Preparando corrección ...

La densidad de la estadística de orden mínima de una colección de iid variables aleatorias continuas con cdf y pdf es F X ( x ) f X ( x ) f X ( 1 ) ( x ( 1 ) ) = n f X ( x ( 1 ) ) [ 1 - F X ( x ( 1 ) ) ] n - 1norteFX(X)FX(X)

FX(1)(X(1))=norteFX(X(1))[1-FX(X(1))]norte-1[1]

Si estas variables aleatorias son normales normales, entonces

FX(1)(X(1))=norteϕ(X(1))[1-Φ(X(1))]norte-1=norteϕ(X(1))[Φ(-X(1))]norte-1[2]
y su valor esperado es
mi(X(1))=norte-X(1)ϕ(X(1))[Φ(-X(1))]norte-1reX(1)[3]

donde hemos usado las propiedades simétricas de la norma normal. En Owen 1980 , p.402, ecuación [ n, 011 ] encontramos que

-zϕ(z)[Φ(unaz)]metrorez=unametro(una2+1)(2π)-ϕ(z)[Φ(unazuna2+1)]metro-1rez[4 4]

Parámetros coincidentes entre las ecuaciones [3] y [4 4] ( una=-1 , metro=norte-1 ) obtenemos

mi(X(1))=-norte(norte-1)2π-ϕ(X(1))[Φ(-X(1)2)]norte-2reX(1)[5 5]

De nuevo en Owen 1980, p. 409, eq [ n0,010.2 ] encontramos que

-[yo=1metroΦ(hyo-reyoz1-reyo2)]ϕ(z)rez=Zmetro(h1,...,hmetro;{ρyoj})[6 6]

donde es el estándar multivariado normal, son los coeficientes de correlación por pares y .Zmetro()ρyoj=reyorej,yoj-1reyo1

Haciendo coincidir y tenemos, , , y [5 5][6 6]metro=norte-2hyo=0 0,yo

reyo1-reyo2=12reyo=±13yoρyoj=ρ=1/ /3

Usando estos resultados, la ecuación convierte en[5 5]

mi(X(1))=-norte(norte-1)2πZnorte-2(0 0,...,0 0;ρ=1/ /3)[7 7]

Esta integral de probabilidad normal estándar multivariada de variables equil correlacionadas, todas evaluadas en cero , ha visto suficiente investigación, y se han derivado varias formas de aproximarla y calcularla. Una revisión extensa (relacionada con el cálculo de integrales de probabilidad normal multivariadas en general) es Gupta (1963) . Gupta proporciona valores explícitos para varios coeficientes de correlación y para hasta 12 variables (por lo que cubre una colección de 14 variables). Los resultados son (LA ÚLTIMA COLUMNA ES INCORRECTA) :

ingrese la descripción de la imagen aquí

Ahora, si graficamos cómo cambia el valor de con , obtendremosZnorte-2(0 0,...,0 0;ρ=1/ /3)norte

ingrese la descripción de la imagen aquí

Entonces llego a mis tres preguntas / solicitudes:
1) ¿Podría alguien verificar analíticamente y / o verificar mediante simulación que los resultados para el valor esperado son correctos (es decir, verificar la validez de la ecuación )?[7 7]

2) Suponiendo que el enfoque es correcto, ¿alguien podría dar la solución para las normales con una media diferente de cero y una varianza no unitaria? Con todas las transformaciones me siento realmente mareado.

3) El valor de la integral de probabilidad parece evolucionar sin problemas. ¿Qué tal aproximarlo con alguna función de ?norte

Alecos Papadopoulos
fuente

Respuestas:

6

Sus resultados no parecen correctos. Esto es fácil de ver, sin ningún cálculo, porque en su tabla, su aumenta con el tamaño de muestra ; claramente, el valor esperado del mínimo de la muestra debe ser más pequeño (es decir, volverse más negativo) a medida que el tamaño de la muestra aumenta .mi[X(1)] nortenorte

El problema es conceptualmente bastante fácil.

En resumen: si ~ con pdf :Xnorte(0 0,1)F(X)

ingrese la descripción de la imagen aquí

... entonces el pdf de la estadística de primer orden (en una muestra de tamaño ) es:norte

ingrese la descripción de la imagen aquí

... obtenido aquí usando la OrderStatfunción en mathStatica, con dominio de soporte:

ingrese la descripción de la imagen aquí

Entonces, , para puede obtener fácilmente exactamente como:mi[X(1)]norte=1,2,3

ingrese la descripción de la imagen aquí

El caso exacto es aproximadamente , que obviamente es diferente a su funcionamiento de -1.06 (línea 1 de su tabla), por lo que parece claro que algo está mal con su funcionamiento (o tal vez mi comprensión de lo que está buscando) .norte=3-0.846284

Para , obtener soluciones de forma cerrada es más complicado, pero incluso si la integración simbólica resulta difícil, siempre podemos usar la integración numérica (con precisión arbitraria si se desea). Esto es realmente muy fácil ... aquí, por ejemplo, es , para el tamaño de muestra a 14, usando Mathematica :norte4 4mi[X(1)]norte=1

 sol = Table[NIntegrate[x g, {x, -Infinity, Infinity}], {n, 1, 14}]

{0., -0.56419, -0.846284, -1.02938, -1.16296, -1.26721, -1.35218, -1.4236, -1.48501, -1.53875, -1.58644, -1.62923, -1.66799, -1.70338}

Todo listo. Estos valores son obviamente muy diferentes a los de su tabla (columna de la derecha).

Para considerar el caso más general de un padre , proceda exactamente como se indica arriba, comenzando con el pdf normal general.norte(μ,σ2)

lobos
fuente
norte4 4