Valor esperado de x en una distribución normal, dado que está por debajo de un cierto valor

12

Solo me pregunto si es posible encontrar el valor esperado de x si se distribuye normalmente, dado que está por debajo de un cierto valor (por ejemplo, por debajo del valor medio).

Jazmín
fuente
Por supuesto que es posible. Como mínimo, puede calcular por la fuerza bruta . O si conoce y , puede estimarlo usando una simulación. F(t)1xtf(t)dtμσ
dsaxton
@dsaxton Hay algunos errores tipográficos en esa fórmula, pero tenemos la idea. Lo que me interesa es cómo ejecutaría exactamente la simulación cuando el umbral esté muy por debajo de la media.
whuber
1
@whuber Sí, debería ser . No sería muy inteligente hacer una simulación cuando está cerca de cero, pero como usted señaló, hay una fórmula exacta de todos modos. F(t)F(x)F(x)
dsaxton
@dsaxton OK, bastante justo. Solo esperaba que tuvieras en mente algún tipo de idea inteligente y simple para simular desde la cola de una distribución normal.
whuber
Más o menos la misma pregunta en Math.SE: math.stackexchange.com/questions/749664/average-iq-of-mensa
JiK

Respuestas:

18

Una variable normalmente distribuida con media y varianza tiene la misma distribución que donde es una variable normal estándar. Todo lo que necesitas saber sobre es queμ σ 2 σ Z + μ Z ZXμσ2σZ+μZZ

  • su función de distribución acumulativa se llama ,Φ
  • tiene una función de densidad de probabilidad , y queϕ(z)=Φ(z)
  • ϕ(z)=zϕ(z) .

Las dos primeras viñetas son solo notación y definiciones: la tercera es la única propiedad especial de las distribuciones normales que necesitaremos.

Deje que el "cierto valor" sea . Anticipando el cambio de a , definaX ZTXZ

t=(Tμ)/σ,

así que eso

Pr(XT)=Pr(Zt)=Φ(t).

Luego, comenzando con la definición de la expectativa condicional, podemos explotar su linealidad para obtener

E(X|XT)=E(σZ+μ|Zt)=σE(Z|Zt)+μE(1|Zt)=(σtzϕ(z)dz+μtϕ(z)dz)/Pr(Zt)=(σtϕ(z)dz+μtΦ(z)dz)/Φ(t).

El teorema fundamental del cálculo afirma que cualquier integral de una derivada se encuentra evaluando la función en los puntos finales: . Esto se aplica a ambas integrales. Como tanto como deben desaparecer en , obtenemosabF(z)dz=F(b)F(a)Φϕ

E(X|XT)=μσϕ(t)Φ(t).

Es la media original menos un término de corrección proporcional a la Relación de molinos inversos .

! [figura: gráfico de la relación inversa de Mills

Como era de esperar, la relación inversa de Mills para debe ser positiva y exceder (cuyo gráfico se muestra con una línea roja punteada). Tiene que disminuir a medida que crece, ya que el truncamiento en (o ) no cambia casi nada. A medida que vuelve muy negativo, la relación inversa de Mills debe aproximarse a porque las colas de la distribución normal disminuyen tan rápidamente que casi toda la probabilidad en la cola izquierda se concentra cerca de su lado derecho (en ).tt0tZ=tX=Tttt

Finalmente, cuando está en la media, donde la relación inversa de Mills es igual a . Esto implica que el valor esperado de , truncado en su media (que es el negativo de una distribución medio normal ), es veces su desviación estándar por debajo de la media original.T=μt=02/π0.797885X2/π

whuber
fuente
6

En general, dejemos que tenga la función de distribución .XF(X)

Tenemos, para , Puede obtener casos especiales tomando, por ejemplo, , que produce .x[c1,c2]

P(Xx|c1Xc2)=P(Xxc1Xc2)P(c1Xc2)=P(c1Xx)P(c1Xc2)=F(x)F(c1)F(c2)F(c1)
c1=F(c1)=0

Usando cdfs condicionales, puede obtener densidades condicionales (p. Ej., para ), que pueden usarse para expectativas condicionales.f(x|X<0)=2ϕ(x)XN(0,1)

En su ejemplo, la integración por partes da como en la respuesta de @ whuber.

E(X|X<0)=20xϕ(x)=2ϕ(0),
Christoph Hanck
fuente
+1 (de alguna manera me perdí esto cuando apareció por primera vez). La primera parte es una excelente explicación de cómo obtener funciones de distribución truncadas y la segunda muestra cómo calcular sus PDF.
whuber