Variable aleatoria uniforme como la suma de dos variables aleatorias

18

Tomado de Grimmet y Stirzaker :

Demuestre que no puede darse el caso de que donde está distribuido uniformemente en [0,1] y e son independientes e idénticamente distribuidos. No debe suponer que X e Y son variables continuas.U X YU=X+YUXY

Una simple prueba de contradicción es suficiente para el caso en el que , se supone discreto al argumentar que siempre es posible encontrar una y tal que mientras que .Xu u P ( U u + u ) P ( U u ) P ( X + Y u ) = P ( X + Y u + u )YuuP(Uu+u)P(Uu)P(X+Yu)=P(X+Yu+u)

Sin embargo, esta prueba no se extiende a es absolutamente continua o singular continua. Consejos / Comentarios / Crítica?X,Y

derechos
fuente
3
Sugerencia : Las funciones características son tus amigos.
cardenal
1
X e Y son iid, por lo que sus funciones características deben ser idénticas. Sin embargo, debe usar la función característica, no la función generadora de momentos: no se garantiza que el mgf exista para X, por lo que mostrar que el mgf tiene una propiedad imposible no significa que no exista tal X. Todos los RV tienen una función característica, así que si demuestras que tiene una propiedad imposible, entonces no existe tal X.
Silverfish
1
Si las distribuciones de e tienen algún átomo , digamos que , entonces lo que no puede distribuirse uniformemente en . Por lo tanto, no es necesario considerar el caso de las distribuciones de e tienen átomos. Y P { X = a } = P { Y = a } = b > 0 P { X + Y = 2 a } b 2 > 0 X + Y [ 0 , 1 ] X YXYP{X=a}=P{Y=a}=b>0P{X+Y=2a}b2>0X+Y[0,1]XY
Dilip Sarwate

Respuestas:

13

El resultado se puede probar con una imagen: las áreas grises visibles muestran que una distribución uniforme no se puede descomponer como la suma de dos variables independientes idénticamente distribuidas.

Notación

Deje que y sean iid tal que tiene una distribución uniforme en . Esto significa que para todos ,Y X + Y [ 0 , 1 ] 0 a b 1XYX+Y[0,1]0ab1

Pr(a<X+Yb)=ba.

Por lo tanto, el soporte esencial de la distribución común de e es (de lo contrario, habría una probabilidad positiva de que encuentre fuera de ).Y [ 0 , 1 / 2 ] X + Y [ 0 , 1 ]XY[0,1/2]X+Y[0,1]

La imagen

Deje . Contempla este diagrama que muestra cómo se calculan las sumas de variables aleatorias:0<ϵ<1/4

Figura

La distribución de probabilidad subyacente es la conjunta para . La probabilidad de cualquier evento viene dada por la probabilidad total cubierta por la banda diagonal que se extiende entre las líneas y . Se muestran tres de estas bandas: de a , que aparecen como un pequeño triángulo azul en la esquina inferior izquierda; de a , que se muestra como un rectángulo gris con dos triángulos (amarillo y verde); y de a , que aparece como un pequeño triángulo rojo en la esquina superior derecha.un < X + Y b x + y = un x + y = b 0 ε 1 / 2 - ε 1 / 2 + ε 1 - ε 1(X,Y)a<X+Ybx+y=ax+y=b0ϵ1/2ϵ1/2+ϵ1ϵ1

Lo que muestra la imagen

Al comparar el triángulo inferior izquierdo de la figura con el cuadrado inferior izquierdo que lo contiene y explotar el supuesto iid para e , queda claro queYXY

ϵ=Pr(X+Yϵ)<Pr(Xϵ)Pr(Yϵ)=Pr(Xϵ)2.

Tenga en cuenta que la desigualdad es estricta: la igualdad no es posible porque hay alguna probabilidad positiva de que tanto como sean menores que pero, sin embargo, .Y ϵ X + Y > ϵXYϵX+Y>ϵ

Del mismo modo, al comparar el triángulo rojo con el cuadrado en la esquina superior derecha,

ϵ=Pr(X+Y>1ϵ)<Pr(X>1/2ϵ)2.

Finalmente, comparar los dos triángulos opuestos en la esquina superior izquierda e inferior derecha con la banda diagonal que los contiene da otra desigualdad estricta,

2ϵ<2Pr(Xϵ)Pr(X>1/2ϵ)<Pr(1/2ϵ<X+Y1/2+ϵ)=2ϵ.

Los primeros sobreviene de desigualdad de las dos anteriores (toman sus raíces cuadradas y multiplicarlos) mientras que el segundo describe el (estricto) la inclusión de los triángulos dentro de la banda y la última igualdad expresa la uniformidad de . La conclusión de que es la contradicción que demuestra que e no pueden existir, QED .X+YX Y2ϵ<2ϵXY

whuber
fuente
3
(+1) Me gusta este enfoque. Al recuperar el dorso de un sobre de la papelera, puedo ver que dibujé el mismo diagrama, excepto que no marqué en los triángulos amarillo y verde dentro de la banda. Obtuve las desigualdades para los triángulos azul y rojo. Jugué con ellos y con algunas otras probabilidades, pero nunca pensé en investigar la probabilidad de la tira, que resultó ser el paso crítico. Me pregunto qué proceso de pensamiento podría haber motivado esta idea.
Silverfish
De hecho, donde @whuber tiene triángulos amarillos y verdes, dibujé en cuadrados (efectivamente descompuse en una cuadrícula). Mirando el paso que "describe la inclusión (estricta) de los triángulos dentro de la banda", , me pregunto si esto sería geométricamente más natural con cuadrados que cubran la banda que triángulos. 2 Pr ( X ε ) Pr ( X > 1 / 2 - ε ) < Pr ( 1 / 2 - ε < X + Y 1 / 2 + ε )[0,0.5]22Pr(Xϵ)Pr(X>1/2ϵ)<Pr(1/2ϵ<X+Y1/2+ϵ)
Silverfish
1
@Silver Me recordó un análisis de sumas de distribuciones uniformes que publiqué hace un par de años. Eso sugirió visualizar la suma geométricamente. Era inmediatamente evidente que había que concentrar mucha probabilidad cerca de las esquinas y para que la suma fuera uniforme y para que la probabilidad relativamente baja estuviera cerca de la diagonal central. . Eso condujo al diagrama, que volví a dibujar en Mathematica. En ese punto, la respuesta se escribió sola. Sí, usar cuadrados en la banda central podría ser más ordenado. ( 0 , 0 ) ( 1 / 2 , 1 / 2 ) X + Y = 1 / 2X+Y(0,0)(1/2,1/2)X+Y=1/2
whuber
¡Gracias! "Nota que la desigualdad es estricta: la igualdad no es posible debido a que hay una cierta probabilidad positiva que cualquiera de o es menor que pero sin embargo ." No estoy seguro de seguir esto. Me parece que el objetivo aquí es mostrar , esto no requiere una probabilidad positiva para algunos evento en el que tanto como son menores o iguales a y, sin embargo, ? Es el "cualquiera de" frente a "ambos" sobre los que estoy vacilando.Y ϵ X + Y > ϵ Pr ( X + Y ϵ ) < Pr ( X ϵ Y ϵ ) A X Y ϵ X + Y > ϵXYϵX+Y>ϵPr(X+Yϵ)<Pr(XϵYϵ)A XYϵX+Y>ϵ
Silverfish
@Silverfish Gracias; No expresé eso como pretendía. Tienes razón: el lenguaje está destinado esencialmente a describir la porción de un pequeño cuadrado que no está dentro del triángulo.
whuber
10

Traté de encontrar una prueba sin considerar las funciones características. El exceso de curtosis hace el truco. Aquí está la respuesta de dos líneas: ya que e son iid. Entonces implica cual es una contradicción como para cualquier variable aleatoria.X Y Kurt ( U ) = - 1.2 Kurt ( X ) = - 2.4 Kurt ( X ) - 2Kurt(U)=Kurt(X+Y)=Kurt(X)/2XYKurt(U)=1.2Kurt(X)=2.4Kurt(X)2

Más interesante es la línea de razonamiento que me llevó a ese punto. (e ) deben estar delimitados entre 0 y 0.5; eso es obvio, pero útil significa que existen sus momentos y momentos centrales. Comencemos considerando la media y la varianza: y . Si e están idénticamente distribuidos, entonces tenemos:Y E ( U ) = 0.5 Var ( U ) = 1XYE(U)=0.5 XYVar(U)=112XY

E(X+Y)=E(X)+E(Y)=2E(X)=0.5

Entonces . Para la variación, adicionalmente, necesitamos usar independencia para aplicar:E(X)=0.25

Var(X+Y)=Var(X)+Var(Y)=2Var(X)=112

Por lo tanto, y . ¡Guauu! Esa es una gran variación para una variable aleatoria cuyo soporte varía de 0 a 0.5. Pero deberíamos haber esperado eso, ya que la desviación estándar no va a escalar de la misma manera que lo hizo la media. σX=1Var(X)=124σX=1260.204

Ahora, ¿cuál es la desviación estándar más grande que puede tener una variable aleatoria si el valor más pequeño que puede tomar es 0, el valor más grande que puede tomar es 0.5 y la media es 0.25? Recolectar toda la probabilidad en masas de dos puntos en los extremos, 0.25 lejos de la media, claramente daría una desviación estándar de 0.25. Entonces nuestro es grande pero no imposible. (Esperaba demostrar que esto implicaba demasiada probabilidad en las colas para que fuera uniforme, pero no pude llegar a ninguna parte con eso en el reverso de un sobre). X + YσXX+Y

Las consideraciones del segundo momento casi imponen una restricción imposible a así que consideremos los momentos más altos. ¿Qué pasa con el coeficiente de asimetría de momento de Pearson , ? Esto existe ya que existen los momentos centrales y . Es útil conocer algunas propiedades de los acumulantes, en particular aplicando independencia y luego una distribución idéntica da:γ 1 = E ( X - μ X ) 3X σX0γ1=E(XμX)3σX3=κ3κ23/2σX0

κi(U)=κi(X+Y)=κi(X)+κi(Y)=2κi(X)

Esta propiedad de aditividad es precisamente la generalización de cómo tratamos la media y la varianza anteriores; de hecho, el primer y segundo acumulantes son solo y .κ 2 = σ 2κ1=μκ2=σ2

Entonces y . La fracción para cancela para producir . Dado que la distribución uniforme tiene un sesgo cero, también lo tiene , pero no puedo ver cómo surge una contradicción de esta restricción.( κ 2 ( U ) ) 3 / 2 = ( 2 κ 2 ( X ) ) 3 / 2 = 2 3 / 2 ( κ 2 ( X ) ) 3 / 2 γ 1 inclinación ( U ) = inclinación ( X + Yκ3(U)=2κ3(X)(κ2(U))3/2=(2κ2(X))3/2=23/2(κ2(X))3/2γ1 XSkew(U)=Skew(X+Y)=Skew(X)/2X

Entonces, en su lugar, intentemos con el exceso de curtosis, . Mediante un argumento similar (esta pregunta es de autoaprendizaje, ¡pruébelo!), Podemos mostrar que existe y obedece:γ2=κ4κ22=E(XμX)4σX43

Kurt(U)=Kurt(X+Y)=Kurt(X)/2

La distribución uniforme tiene exceso de curtosis por lo que se requiere que tenga exceso de curtosis . Pero el exceso de curtosis más pequeño posible es , que se logra mediante la distribución de Bernoulli .X - 2.4 - 2 Binomial ( 1 , 11.2X2.42Binomial(1,12)

Lepisma
fuente
2
(+1) Este es un enfoque bastante inteligente, que era nuevo para mí. Gracias. Tenga en cuenta que parte de su análisis podría haberse simplificado al considerar un uniforme centrado en cero. (La equivalencia del problema es inmediata). Eso le habría dicho de inmediato que considerar el sesgo era un callejón sin salida.
cardenal
@cardinal: Sabía que el sesgo era un callejón sin salida antes de trabajar en ello. El propósito era expositivo: es una pregunta de autoestudio, ¡así que no quería resolverla por completo! Más bien quería dejar una pista sobre cómo lidiar con el siguiente nivel ...
Silverfish
@ cardinal: estaba en dos mentes si centrarme o no. Hice los cálculos de reverso de forma más conveniente, pero en el análisis final solo necesitamos (1) un caso simple del resultado general de que para iid , (2) que para cualquier distribución uniforme, y (3) existe ya que está acotado y (que es trivial, de lo contrario ). Por lo tanto, ninguno de los resultados clave realmente requirió centrado, ¡aunque los bits pueden haber parecido menos feos! XiKurt(U)=-1.2Kurt(X)XσX0σU=0Kurt(X1+...+Xn)=1nKurt(X)XiKurt(U)=1.2Kurt(X)XσX0σU=0
Silverfish
Sí, la palabra "aerodinámica" fue cuidadosamente elegida. :-) No pretendía que mi comentario fuera leído como crítica de su exposición. Salud.
cardenal
@cardinal Por cierto, solo las consideraciones de variación casi funcionaron, pero el uniforme no está lo suficientemente extendido. Con un poco más de probabilidad de masa más cerca de los extremos, por ejemplo, en [-0.5, 0.5], luego y si entonces que es imposible ya que está limitado por -0.25 y 0.25. ¡Por supuesto, verá de inmediato cómo se relaciona esto con el presente ejemplo! Me pregunto si el enfoque se generaliza, estoy seguro de que otros vehículos recreativos limitados no se pueden descomponer en sumas, pero requieren momentos aún más altos investigados para encontrar la contradicción. V a r ( T ) = .15 T = X 1 + X 2 σ X = fT(t)=12t2Var(T)=.15T=X1+X2XσX=.15/20.27>0.25X
Silverfish