Tengo cuatro variables independientes uniformemente distribuidas , cada una en . Quiero calcular la distribución de . Calculé la distribución de para ser
Hice cuatro conjuntos independientes constaban de 10 6 números cada uno y dibujé un histograma de ( a - d ) 2 + 4 b c :
y dibujó una gráfica de :
Generalmente, la gráfica es similar al histograma, pero en el intervalo mayor parte es negativa (la raíz está en 2.27034). Y la integral de la parte positiva es ≈ 0.77 .
¿Dónde está el error? ¿O dónde me estoy perdiendo algo?
EDITAR: Escalé el histograma para mostrar el PDF.
EDIT 2: Creo que sé dónde está el problema en mi razonamiento, en los límites de integración. Debido y x - y ∈ ( 0 , 1 ] , no puedo simplemente ∫ x 0 El gráfico muestra la región tengo que integrar en:.
Esto significa que tengo para y ∈ ( 0 , 1 ] (es por eso que parte de mi f era correcta), ∫ x x - 1 en y ∈ ( 1 , 4 ] y ∫ 4 x - 1 en y ∈ ( 4 , 5. ] Desafortunadamente, Mathematica no puede calcular las dos últimas integrales (bueno, calcula la segunda, porque hay una unidad imaginaria en la salida que estropea todo ...).
EDITAR 3: Parece que Mathematica PUEDE calcular las últimas tres integrales con el siguiente código:
(1/4)*Integrate[((1-Sqrt[u1-u2])*Log[4/u2])/Sqrt[u1-u2],{u2,0,u1},
Assumptions ->0 <= u2 <= u1 && u1 > 0]
(1/4)*Integrate[((1-Sqrt[u1-u2])*Log[4/u2])/Sqrt[u1-u2],{u2,u1-1,u1},
Assumptions -> 1 <= u2 <= 3 && u1 > 0]
(1/4)*Integrate[((1-Sqrt[u1-u2])*Log[4/u2])/Sqrt[u1-u2],{u2,u1-1,4},
Assumptions -> 4 <= u2 <= 4 && u1 > 0]
que da una respuesta correcta :)
fuente
Respuestas:
A menudo ayuda a usar funciones de distribución acumulativa.
Primero,
Próximo,
Letδ range between the smallest (0 ) and largest (5 ) possible values of (a−d)2+4bc . Writing x=(a−d)2 with CDF F and y=4bc with PDF g=G′ , we need to compute
We can expect this to be nasty--the uniform distribution PDF is discontinuous and thus ought to produce breaks in the definition ofH --so it is somewhat amazing that Mathematica obtains a closed form (which I will not reproduce here). Differentiating it with respect to δ gives the desired density. It is defined piecewise within three intervals. In 0<δ<1 ,
In1<δ<4 ,
And in4<δ<5 ,
This figure overlays a plot ofh on a histogram of 106 iid realizations of (a−d)2+4bc . The two are almost indistinguishable, suggesting the correctness of the formula for h .
The following is a nearly mindless, brute-force Mathematica solution. It automates practically everything about the calculation. For instance, it will even compute the range of the resulting variable:
Here is all the integration and differentiation. (Be patient; computingH takes a couple of minutes.)
Finally, a simulation and comparison to the graph ofh :
fuente
Like the OP and whuber, I would use independence to break this up into simpler problems:
LetX=(a−d)2 . Then the pdf of X , say f(x) is:
LetY=4bc . Then the pdf of Y , say g(y) is:
The problem reduces to now finding the pdf ofX+Y . There may be many ways of doing this, but the simplest for me is to use a function called
TransformSum
from the current developmental version of mathStatica. Unfortunately, this is not available in a public release at the present time, but here is the input:which returns the pdf ofZ=X+Y as the piecewise function:
Here is a plot of the pdf just derived, sayh(z) :
Quick Monte Carlo check
The following diagram compares an empirical Monte Carlo approximation of the pdf (squiggly blue) to the theoretical pdf derived above (red dashed). Looks fine.
fuente