Considere
donde son iid y se mantiene el CLT.
¿Cuántos de los términos más importantes suman la mitad de la suma total?
Por ejemplo, 10 + 9 + 8 (10 + 9 + 8 + 1) / 2: el 30% de los términos alcanzan aproximadamente la mitad del total.X 1 , ... , X N ≈ ...
Defina
¿Hay un resultado asintótico general para halfsum ( )?
Una derivación simple e intuitiva sería buena.
(Un poco de Monte Carlo sugiere que a veces la mitad de la suma ( ) / 4 más o menos;
es decir, el 1/4 más grande de la suma hasta la mitad del total.
Obtengo 0.24 para la mitad normal, 0.19 para exponencial, para = 20, 50, 100.)
Respuestas:
No, no hay un resultado asintótico general. Sea el orden , donde es el más grande. x i x [ 1 ]x[1]…x[N] xi x[1]
Considere los siguientes dos ejemplos:
1) . Claramente el CLT se mantiene. Solo necesita observación para. M = 1 ∑ M j = 1 | x [ j ] | ≥ 1P(x=0)=1 M=1 ∑Mj=1|x[j]|≥12∑N|xi|
2) . Claramente el CLT se mantiene. Necesita observaciones para.P(x=1)=1 M=⌈N/2⌉ ∑Mj=1|x[j]|≥12∑N|xi|
Para un ejemplo no trivial, la distribución de Bernoulli:
3) . Una vez más se mantiene el CLT. Necesita de las observaciones para cumplir con sus condiciones. Al variar entre 0 y 1, puede acercarse lo más posible al ejemplo 1 o al ejemplo 2.P(x=1)=p, P(x=0)=1−p ⌈pN/2⌉ p
fuente
Aquí hay un argumento crudo que da una estimación ligeramente diferente para variables aleatorias distribuidas uniformemente. Supongamos que son variables aleatorias continuas distribuidas uniformemente en . Entonces, tiene un valor medio . Suponga que por una coincidencia sorprendente y totalmente increíble, la suma es exactamente igual a . Por lo tanto, queremos estimar cuántos de los valores más grandes de suman o más. Ahora, el histograma de muestras ( muy grandes) extraídas de la distribución uniforme es aproximadamente plano de aXi [0,1] ∑iXi N/2 N/2 X N/4 N N U[0,1] 0 1 y, por lo tanto, para cualquier , , hay
muestras distribuidas aproximadamente de manera uniforme entre a . Estas muestras tienen un valor promedio y una suma igual a
. La suma excede para . Entonces, la suma de muestras más grandes excede
.x 0<x<1 (1−x)N x 1 (1+x)/2 (1−x)N(1+x)/2)=(1−x2)N/2 N/4 x≤1/2–√ (1−1/2–√)N≈0.3N N/4
Podrías intentar generalizar esto un poco. Si , entonces para cualquier dado , queremos que sea tal que donde sea normal con media y varianza . Por lo tanto, condicionado a un valor de , . Multiplique por la densidad de e integre (de a ) para encontrar el número promedio de muestras más grandes que excederá la mitad de la suma aleatoria.∑iXi=Y Y x (1−x2)N/2=Y/2 Y N/2 N/12 Y x=1−(Y/N)−−−−−−−−−√ Y Y=0 Y=N
fuente
Supongamos que X solo tiene valores positivos para deshacerse del valor absoluto.
Sin una prueba exacta, creo que tienes que resolver k
y luego la respuesta se tomando los valores más altos de .n(1−FX(k))
Mi lógica es que, de forma asimétrica, la suma de todos los valores superiores a k debería ser aproximadamente
y asimétricamente la mitad de la suma total es aproximadamente
La simulación numérica muestra que el resultado se cumple para el caso uniforme (uniforme en ) donde y obtengo . No estoy seguro de si el resultado siempre se cumple o si se puede simplificar aún más, pero creo que realmente depende de la función de distribución F.F ( k ) = k k = √[0,1] F(k)=k k=(√12)
fuente