Distribución de la diferencia entre dos distribuciones normales.

21

Tengo dos funciones de densidad de probabilidad de distribuciones normales:

f1(x1|μ1,σ1)=1σ12πe(xμ1)22σ12

y

f2(x2|μ2,σ2)=1σ22πe(xμ2)22σ22

Estoy buscando la función de densidad de probabilidad de la separación entre y x_2 . Creo que eso significa que estoy buscando la función de densidad de probabilidad de | x_1 - x_2 | . ¿Es eso correcto? ¿Cómo encuentro eso?x1x2|x1x2|

Martijn
fuente
Si esto es tarea, use la self-studyetiqueta. Aceptamos preguntas de tarea, pero las manejamos de manera un poco diferente aquí.
shadowtalker
Además, no quiero ser "ese tipo", pero ¿intentaste con Google? La "diferencia entre distribuciones normales" me encontró una respuesta casi de inmediato.
shadowtalker
@ssdecontrol no, no es tarea, pero es para un proyecto de pasatiempo, así que no me importa tener que averiguar algunas cosas por mí mismo si estoy en el camino correcto. Intenté google, pero mi comprensión del asunto es tan limitada que probablemente no lo reconocería si estuviera frente a mí. entre comillas encontré muchas cosas similares a "cuál es la diferencia entre una distribución normal y x" para algunas x.
Martijn

Respuestas:

26

Esta pregunta puede responderse como se indica solo asumiendo que las dos variables aleatorias y regidas por estas distribuciones son independientes. X 2X1X2 Esto hace su diferencia Normal con media y varianza . (La siguiente solución se puede generalizar fácilmente a cualquier distribución normal bivariada de .) Por lo tanto, la variable μ= μ 2 - μ 1 σ 2 = σ 2 1 + σ 2 2 ( X 1 , X 2 )X=X2X1μ=μ2μ1σ2=σ12+σ22(X1,X2)

Z=Xμσ=X2X1(μ2μ1)σ12+σ22

tiene una distribución Normal estándar (es decir, con media cero y varianza unitaria) y

X=σ(Z+μσ).

La expresion

|X2X1|=|X|=X2=σ(Z+μσ)2

exhibe la diferencia absoluta como una versión escalada de la raíz cuadrada de una distribución chi-cuadrado no central con un grado de libertad y parámetro de no centralidad . Una distribución de chi-cuadrado no central con estos parámetros tiene un elemento de probabilidadλ=(μ/σ)2

f(y)dy=y2πe12(λy)cosh(λy)dyy, y>0.

Escribir para establece una correspondencia uno a uno entre y su raíz cuadrada, lo que resulta en x > 0 yy=x2x>0y

f(y)dy=f(x2)d(x2)=x22πe12(λx2)cosh(λx2)dx2x2.

Simplificando esto y luego reescalando por da la densidad deseadaσ

f|X|(x)=1σ2πcosh(xμσ2)exp(x2+μ22σ2).

Este resultado está respaldado por simulaciones, como este histograma de 100,000 sorteos independientes de(llamado "x" en el código) con los parámetros . En él se traza el gráfico de , que coincide perfectamente con los valores del histograma.μ 1 = - 1 , μ 2 = 5 , σ 1 = 4 , σ 2 = 1 f | X ||X|=|X2X1|μ1=1,μ2=5,σ1=4,σ2=1f|X|

Figura

El Rcódigo para esta simulación sigue.

#
# Specify parameters
#
mu <- c(-1, 5)
sigma <- c(4, 1)
#
# Simulate data
#
n.sim <- 1e5
set.seed(17)
x.sim <- matrix(rnorm(n.sim*2, mu, sigma), nrow=2)
x <- abs(x.sim[2, ] - x.sim[1, ])
#
# Display the results
#
hist(x, freq=FALSE)
f <- function(x, mu, sigma) {
 sqrt(2 / pi) / sigma * cosh(x * mu / sigma^2) * exp(-(x^2 + mu^2)/(2*sigma^2)) 
}
curve(f(x, abs(diff(mu)), sqrt(sum(sigma^2))), lwd=2, col="Red", add=TRUE)
whuber
fuente
¿Cómo sería esto diferente si quiero obtener la diferencia al cuadrado? Por ejemplo, si quiero ? (f1(.)f2(.))2
user77005
1
@ user77005 La respuesta a eso está en mi publicación: es una distribución chi-cuadrado no central. Sigue el enlace para más detalles.
whuber
22

Estoy proporcionando una respuesta que es complementaria a la de @whuber en el sentido de ser lo que un no estadístico (es decir, alguien que no sabe mucho sobre distribuciones de chi-cuadrado no centrales con un grado de libertad, etc.) podría escribir, y que un neófito podría seguir con relativa facilidad.

Tomando prestado el supuesto de independencia, así como la anotación de la respuesta de Whuber , donde y . Por lo tanto, para , y, por supuesto, para . Se sigue al diferenciar con respecto a que Z=X1X2N(μ,σ2)μ=μ1μ2σ2=σ12+σ22x0

F|Z|(x)P{|Z|x}=P{xZx}=P{x<Zx}since Z is a continuous random variable=FZ(x)FZ(x),
F|Z|(x)=0x<0x
f|Z|(x)xF|Z|(x)=[fZ(x)+fZ(x)]1(0,)(x)=[exp((xμ)22σ2)σ2π+exp((x+μ)22σ2)σ2π]1(0,)(x)=exp(x2+μ22σ2)σ2π(exp(xμσ2)+exp(xμσ2))1(0,)(x)=1σ2πcosh(xμσ2)exp(x2+μ22σ2)1(0,)(x)
que es exactamente el mismo resultado que en la respuesta de whuber, pero llegó de manera más transparente.
Dilip Sarwate
fuente
1
+1 Siempre me gusta ver soluciones que funcionen desde los principios y supuestos más básicos posibles.
whuber
1

La distribución de una diferencia de dos variantes distribuidas normalmente X e Y también es una distribución normal, suponiendo que X e Y son independientes (gracias Mark por el comentario). Aquí hay una derivación: http://mathworld.wolfram.com/NormalDifferenceDistribution.html

Aquí está preguntando la diferencia absoluta, basada en la respuesta de Whuber y si suponemos que la diferencia en la media de X e Y es cero, es solo una distribución medio normal con dos veces la densidad (gracias Dilip por el comentario).

Yuqian
fuente
3
Usted y Wolfram Mathworld están asumiendo implícitamente que las 2 distribuciones normales (variables aleatorias) son independientes. La diferencia ni siquiera se distribuye necesariamente de manera normal si las 2 variables aleatorias normales no son bivariadas, lo que puede suceder si no son independientes ...
Mark L. Stone
44
Además del supuesto señalado por Mark, también ignora el hecho de que los medios son diferentes. El caso medio normal solo funciona cuando para que la diferencia tenga una media de . 0μ1=μ20
Dilip Sarwate
Gracias por tus comentarios. Ahora revisé mi respuesta en función de sus comentarios y la respuesta de Whuber.
yuqian