Suma de productos de variables aleatorias Rademacher

9

Supongamos que son variables aleatorias independientes que toman valores o con probabilidad 0.5 cada uno. Considere la suma . Deseo el límite superior de la probabilidad . El mejor límite que tengo en este momento es donde c es una constante universal. Esto se logra limitando la probabilidad Pr (| x_1 + \ dots + x_n | <\ sqrt {t}) y Pr (| y_1 + \ dots + y_n | <\ sqrt {t}) mediante la aplicación de límites simples de Chernoff. ¿Puedo esperar obtener algo que sea significativamente mejor que este límite? Para empezar, ¿puedo al menos obtenerx1xa,y1yb+11S=i,jxi×yjP(|S|>t)2ectmax(a,b)cPr(|x1++xn|<t)Pr(|y1++yn|<t)ectab . Si puedo obtener colas subgaussianas, eso probablemente sería lo mejor, pero ¿podemos esperar eso (no lo creo pero no puedo pensar en una discusión)?

usuario1189053
fuente
¿Ha considerado aplicar el Chernoff vinculado directamente a S ? Es posible que pueda hacer algo con
E[exp(λS]=E[λijXiYj]=E[λ(iXi)(jYj)]
Dilip Sarwate
Hay una mejora obvia en su límite para t>ab , ya que la probabilidad debe ser cero. Me parece que es una cola "subgaussiana" :-). También parece que su límite es incorrecto: las variables que son constantemente 1 satisfacen las condiciones de esta pregunta. Para a=b y t=a21 la probabilidad es 1 pero su límite es asintóticamente 2exp(ca)0 como a crece grande.
whuber
La probabilidad de que todas las variables sean 1 disminuye exponencialmente. No creo entender tu comentario. Para y el I ligado declarado es bastante trivialmente verdadera como la probabilidad de la suma es mayor que esa=bt=a21t212(a1)eln(2)c(a1/a)
usuario1189053
1
Realmente lamento un error mío. Pensé que había mencionado uniformemente arriba. Así p = 1/2 y nos puede llevar a y b mayor que cualquier constante (si es necesario) para la desigualdad de retención
user1189053
2
A menos que mis ojos me estén engañando, está considerando una suma de productos, no un producto de sumas. :-)
cardenal

Respuestas:

7

La relacion algebraica

S=i,jxiyj=ixijyj

exhibe como el producto de dos sumas independientes. Como y son variantes independientes de Bernoulli , es una variable binomial que ha sido duplicado y desplazado. Por lo tanto, su media es y su varianza es . Del mismo modo, tiene una media de y una varianza de . Estandaricemos ahora mismo definiendoS(xi+1)/2(yj+1)/2(1/2)X=i=1axi(a,1/2)0aY=j=1byj0b

Xa=1ai=1axi,

De dónde

S=abXaXb=abZab.

Para un alto (y cuantificable) grado de precisión, como aumenta de tamaño aproxima a la distribución normal estándar. Por lo tanto, aproximaremos como veces el producto de dos normales estándar.aXaSab

El siguiente paso es notar que

Zab=XaXb=12((Xa+Xb2)2(XaXb2)2)=12(U2V2).

es un múltiplo de la diferencia de los cuadrados de las variables normales estándar independientes y . La distribución de puede calcularse analíticamente ( invirtiendo la función característica ): su pdf es proporcional a la función de Bessel de orden cero, . Debido a que esta función tiene colas exponenciales, llegamos a la conclusión inmediata de que para y grandes y fija , no hay mejor aproximación a que la dada en la pregunta.UVZabK0(|z|)/πabtPra,b(S>t)

Queda algo de mejora cuando uno (al menos) de y no es grande o en puntos en la cola de cerca de . Los cálculos directos de la distribución de muestran una disminución curva de las probabilidades de cola en puntos mucho más grandes que , aproximadamente más allá de . Estas gráficas log-lineales del CDF de para varios valores de (dados en los títulos) (que varían aproximadamente sobre los mismos valores que , distinguidos por el color en cada gráfica) muestran lo que está sucediendo. Como referencia, la gráfica de la limitaciónabS±abSababmax(a,b)SabaK0La distribución se muestra en negro. (Debido a que es simétrica alrededor de , , entonces es suficiente mirar la cola negativa).S0Pr(S>t)=Pr(S<t)

Cifras

A medida que crece, el CDF se acerca a la línea de referencia.b

Caracterizar y cuantificar esta curvatura requeriría un análisis más fino de la aproximación normal a las variantes binomiales.

La calidad de la aproximación de la función de Bessel se vuelve más clara en estas porciones ampliadas (de la esquina superior derecha de cada gráfico). Ya estamos bastante lejos en las colas. Aunque la escala vertical logarítmica puede ocultar diferencias sustanciales, claramente para cuando ha alcanzado la aproximación es buena para .a500|S|<ab

Inserciones


Código R para calcular la distribución deS

Lo siguiente tardará unos segundos en ejecutarse. (Se calcula varios millones de probabilidades para 36 combinaciones de y .) En las máquinas más lentas, omitir los más grandes uno o dos valores de y y aumentar el límite de trazado inferior de de alrededor de .abab1030010160

s <- function(a, b) {
  # Returns the distribution of S as a vector indexed by its support.
  products <- factor(as.vector(outer(seq(-a, a, by=2), seq(-b, b, by=2))))
  probs <- as.vector(outer(dbinom(0:a, a, 1/2), dbinom(0:b, b, 1/2)))
  tapply(probs, products, sum)
}

par(mfrow=c(2,3))
b.vec <- c(51, 101, 149, 201, 299, 501)
cols <- terrain.colors(length(b.vec)+1)
for (a in c(50, 100, 150, 200, 300, 500)) {
  plot(c(-sqrt(a*max(b.vec)),0), c(10^(-300), 1), type="n", log="y", 
       xlab="S/sqrt(ab)", ylab="CDF", main=paste(a))
  curve(besselK(abs(x), 0)/pi, lwd=2, add=TRUE)
  for (j in 1:length(b.vec)) {
    b <- b.vec[j]
    x <- s(a,b)
    n <- as.numeric(names(x))
    k <- n <= 0
    y <- cumsum(x[k])
    lines(n[k]/sqrt(a*b), y, col=cols[j], lwd=2)
  }
}
whuber
fuente
1
¡Muy bien hecho! Se puede obtener una forma exacta para el cdf del producto de 2 normales normales ... para la cola negativa, es 1/2 (1 + y BesselK[0,-y] StruveL[-1, y] - y BesselK[1,-y] StruveL[0, y]). Sería interesante ver cómo: (a) se realiza el límite del OP, y (b) se realiza su aproximación normal, para el caso que estábamos viendo anteriormente, es decir, derivado usando la solución discreta pmf exacta. a=5,b=7
Wolfies
1
@wolfies Sí, también obtuve esa expresión: integra la cola de . Debido a que la distribución exacta se aparta de ella en las colas extremas, no parecía valioso llevar el análisis de esa integral más adelante. El siguiente paso lógico es un análisis más perspicaz de las colas, lo que significa ir más allá de la aproximación normal. K0
whuber
3

Comentario: edité el título en un intento de reflejar mejor qué tipo de vehículos se consideran en la pregunta. Cualquiera puede reeditar libremente.

Motivación: supongo que no hay necesidad de conformarse con un límite superior, si podemos derivar la distribución de. ( ACTUALIZACIÓN : No podemos ver los comentarios y la respuesta de Whuber).|Sab|

Denotan . Es fácil verificar que 's tienen la misma distribución que la ' s y el 's. La función generadora de momento esZk=XiYj,k=1,...,abZXY

MZ(t)=E[ezt]=12et+12et=cosh(t)

Además, las son, para empezar, independientes por pares: la variable (los índices pueden ser cualquiera, por supuesto), tiene soporte con las probabilidades correspondientes . Su función generadora de momento esZW=Z1+Z2{2,0,2}{1/4,1/2,1/4}

MW(t)=E[e(z1+z2)t]=14e2t+12+14e2t==14(e2t+1)+14(e2t+1)=142etcosh(t)+142etcosh(t)=cosh(t)cosh(t)=MZ1(t)MZ2(t)

Intentaré sospechar que la independencia total es válida, como sigue (¿es obvio para los más sabios?): Para esta parte, denote . Luego, por la regla de la cadena Zij=XiYj

P[Zab,...,Z11]=P[ZabZa,b1,...,Z11]...P[Z13Z12,Z11]P[Z12Z11]P[Z11]

Por independencia en pares, tenemos . Considere . y son condicionales independientes de por lo que tenemos la segunda igualdad por independencia en pares. Pero esto implica queP[Z12Z11]=P[Z12]
P[Z13,Z12Z11]Z13Z12Z11

P[Z13Z12,Z11]=P[Z13Z11]=P[Z13]

P[Z13Z12,Z11]P[Z12Z11]P[Z11]=P[Z13,Z12,Z11]=P[Z13]P[Z12]P[Z11]

Etc (creo). ( ACTUALIZACIÓN : Pienso mal . La independencia probablemente sea válida para cualquier triplete, pero no para todo el grupo. Entonces, lo que sigue es solo la derivación de la distribución de una caminata aleatoria simple, y no una respuesta correcta a la pregunta: vea Wolfies y Las respuestas de Whuber).

Si la independencia total es válida, tenemos la tarea de derivar la distribución de una suma de iid dicotómicos rv's

Sab=k=1abZk

que parece una simple caminata aleatoria , aunque sin la clara interpretación de este último como una secuencia.

Si el soporte de serán los enteros pares en incluyendo cero, mientras que si el soporte de serán los enteros impares en , sin cero. ab=evenS[ab,...,ab]ab=oddS[ab,...,ab]

Tratamos el caso de . Denote como el número de toman el valor . Entonces el soporte de se puede escribir . Para cualquier dado , obtenemos un valor único para . Además, debido a las probabilidades simétricas y la independencia (¿o solo a la intercambiabilidad?), Todas las posibles realizaciones conjuntas de las variables son equiprobables. Entonces contamos y encontramos que la función de masa de probabilidad de es,ab=odd
mZ1SS{ab2m;mZ+{0};mab}mSZ{Z1=z1,...,Zab=zab}S

P(S=ab2m)=(abm)12ab,0mab

Definiendo , y número impar por construcción, y el elemento típico del soporte de , tenemossab2mS

P(S=s)=(ababs2)12ab

Mudarse a, dado que si , la distribución de es simétrica alrededor de cero sin asignar la masa de probabilidad a cero, por lo que la distribución dese obtiene "doblando" el gráfico de densidad alrededor del eje vertical, esencialmente duplicando las probabilidades de valores positivos,|S|ab=oddS|S|

P(|S|=|s|)=(ababs2)12ab1

Entonces la función de distribución es

P(|S||s|)=12ab11is,iodd(ababi2)

Por lo tanto, para cualquier real , , obtenemos la probabilidad requerida t1t<ab

P(|S|>t)=1P(|S|t)=112ab11it,iodd(ababi2)

Tenga en cuenta que la indicación garantiza que la suma se ejecutará solo hasta valores incluidos en el soporte de- por ejemplo, si establecemos , todavía a correr hasta , ya que está limitado a ser impar, además de ser un número entero.i=odd|S|t=10.5i9

Alecos Papadopoulos
fuente
El número de valores negativos en debe ser par . Por lo tanto, estas cuatro variables aleatorias (supongo que son cuatro de sus s, la notación no está clara) no son independientes. (X1Y1,X1Y2,X2Y1,X2Y2)Z
whuber
@whuber Gracias. El problema (mi problema, es decir) es que sigo obteniendo independencia en cualquier ejemplo específico que resuelva. Trabajaré las cuatro variables específicas que escribes.
Alecos Papadopoulos
Sí, es complicado porque las distintas son independientes en pares y (creo) que las tres distintas también son independientes. (¡Voté su respuesta por su ataque creativo al problema y espero estar equivocado en mi evaluación de la falta de independencia!)ZZ
whuber
@whuber Gracias de nuevo whuber, eso es realmente de apoyo. Estoy pensando que lo que necesitamos para que la derivación de la distribución de sea ​​válida es que todos los eventos son equiprobables. ¿Es posible que tal propiedad se mantenga mientras la independencia conjunta falla? Quiero decir, la independencia conjunta es suficiente para mantener la equiprobabilidad, pero ¿también es necesaria? S{k=1abZk}
Alecos Papadopoulos
Me temo que no entiendo su notación, que parece referirse a una intersección de variables aleatorias (lo que sea que eso signifique).
whuber
3

No es una respuesta, sino un comentario sobre la interesante respuesta de Alecos que es demasiado largo para caber en un cuadro de comentarios.

Deje que sean variables aleatorias independientes de Rademacher, y deje que sean variables aleatorias independientes de Rademacher. Alecos señala que:(X1,...,Xa)(Y1,...,Yb)

Sab=k=1abZkwhereZk=XiYj

"... parece una simple caminata aleatoria ". Si fuera como una simple caminata aleatoria, entonces la distribución de sería simétrica 'unimodal en forma de campana' alrededor de 0.S

Para ilustrar que no se trata de una simple caminata aleatoria, aquí hay una comparación rápida de Monte Carlo de:

  • puntos del triángulo: simulación Monte Carlo de la pmf de dado ySa=5b=7
  • puntos redondos: simulación de Monte Carlo de una caminata aleatoria simple con pasosn=35

ingrese la descripción de la imagen aquí

Claramente, no es una simple caminata aleatoria; También tenga en cuenta que S no se distribuye en todos los enteros pares (o impares).S

Monte Carlo

Aquí está el código (en Mathematica ) utilizado para generar una única iteración de la suma , dados y :Sab

 SumAB[a_, b_] :=  Outer[Times, RandomChoice[{-1, 1}, a], RandomChoice[{-1, 1}, b]] 
                         // Flatten // Total 

Entonces, 500.000 tales caminos, dicen cuando y , se pueden generar con:a=5b=7

 data57 = Table[SumAB[5, 7], {500000}];

El dominio de soporte para esta combinación de y es:ab

{-35, -25, -21, -15, -9, -7, -5, -3, -1, 1, 3, 5, 7, 9, 15, 21, 25, 35}
lobos
fuente
1
+1 Hace mucho que se necesitaba una simulación (o algún ejemplo concreto de este tipo) para darnos una referencia para un análisis posterior. Su simulación puede hacerse mucho más eficiente (aproximadamente 25 veces más rápido) al observar que los factores son . Eso explica de inmediato por qué no pueden aparecer valores primos suficientemente grandes en su gráfico triangular, y demuestra a la fuerza que no puede tener una distribución de "caminata aleatoria" (binomial a escala). S(ixi)(jyj)S
whuber
1
En lugar de simular que puede obtener rápidamente la respuesta exacta (para ay btanto menos de 1000, de todos modos) como rademacher[a_] := Transpose[{Range[-a, a, 2], Array[Binomial[a, #] &, a + 1, 0] /2^a}]; s[a_, b_] := {#[[1, 1]], Total[#[[;; , 2]]]} & /@ GatherBy[Flatten[Outer[Times, rademacher[a], rademacher[b], 1], 1], First]; ListLogPlot[s[5, 7]] Inténtelo con, por ejemplo, s[100,211].
whuber
@whuber re primer comentario: ¡tu factorización es súper ordenada! :) En mi Mac, usando: ......... WHuberSumAB[a_, b_] := Total[RandomChoice[{-1, 1}, a]] * Total[RandomChoice[{-1, 1}, b]]... es el doble de rápido que el Outerenfoque. ¿Tienes curiosidad por saber qué código estás usando? [Ambos enfoques pueden, por supuesto, hacerse más rápido usando ParallelTable, etc.]
wolfies
Prueba esto: sum[n_, a_, b_] := Block[{w, p}, w[x_] := Array[Binomial[x, #] &, x + 1, 0] /2^x; p[x_] := RandomChoice[w[x] -> Range[-x, x, 2], n]; p[a] p[b]]. Entonces el tiempo Tally[sum[500000, 5, 7]]. Para Raficianodos, la siguiente hace lo mismo y toma sólo el 50% más largo que Mathematica : s <- function(n, a, b) (2 * rbinom(n, a, 1/2) - a)*(2 * rbinom(n, b, 1/2) - b); system.time(x <- table(s(5*10^5, 5, 7))); plot(log(x), col="#00000020").
whuber
@whuber - re comment2 - pmf exacto: entonces tienes , donde cada suma de Rademacher es un Binomial, y entonces tenemos El producto de 2 Binomios. ¿Por qué no escribir esto como respuesta? - es bonito, ordenado, elegante y útil ...S=(iXi)(jYj)
wolfies