Considere
donde son iid y se mantiene el CLT. 
¿Cuántos de los términos más importantes suman la mitad de la suma total? 
Por ejemplo, 10 + 9 + 8 (10 + 9 + 8 + 1) / 2: el 30% de los términos alcanzan aproximadamente la mitad del total.X 1 , ... , X N ≈ ...
Defina
¿Hay un resultado asintótico general para halfsum ( )? 
Una derivación simple e intuitiva sería buena.
(Un poco de Monte Carlo sugiere que a veces la mitad de la suma ( ) / 4 más o menos; 
es decir, el 1/4 más grande de la suma hasta la mitad del total. 
Obtengo 0.24 para la mitad normal, 0.19 para exponencial, para = 20, 50, 100.)

Respuestas:
No, no hay un resultado asintótico general. Sea el orden , donde es el más grande. x i x [ 1 ]x[1]…x[N] xi x[1] 
Considere los siguientes dos ejemplos:
1) . Claramente el CLT se mantiene. Solo necesita observación para. M = 1 ∑ M j = 1 | x [ j ] | ≥ 1P(x=0)=1 M=1 ∑Mj=1|x[j]|≥12∑N|xi| 
2) . Claramente el CLT se mantiene. Necesita observaciones para.P(x=1)=1 M=⌈N/2⌉ ∑Mj=1|x[j]|≥12∑N|xi| 
Para un ejemplo no trivial, la distribución de Bernoulli:
3) . Una vez más se mantiene el CLT. Necesita de las observaciones para cumplir con sus condiciones. Al variar entre 0 y 1, puede acercarse lo más posible al ejemplo 1 o al ejemplo 2.P(x=1)=p, P(x=0)=1−p ⌈pN/2⌉ p 
fuente
Aquí hay un argumento crudo que da una estimación ligeramente diferente para variables aleatorias distribuidas uniformemente. Supongamos que son variables aleatorias continuas distribuidas uniformemente en . Entonces, tiene un valor medio . Suponga que por una coincidencia sorprendente y totalmente increíble, la suma es exactamente igual a . Por lo tanto, queremos estimar cuántos de los valores más grandes de suman o más. Ahora, el histograma de muestras ( muy grandes) extraídas de la distribución uniforme es aproximadamente plano de aXi [0,1] ∑iXi N/2 N/2 X N/4 N N U[0,1] 0 1 y, por lo tanto, para cualquier , , hay 
 muestras distribuidas aproximadamente de manera uniforme entre a . Estas muestras tienen un valor promedio y una suma igual a 
 . La suma excede para . Entonces, la suma de muestras más grandes excede
 .x 0<x<1 (1−x)N x 1 (1+x)/2 (1−x)N(1+x)/2)=(1−x2)N/2 N/4 x≤1/2–√ (1−1/2–√)N≈0.3N N/4 
Podrías intentar generalizar esto un poco. Si , entonces para cualquier dado , queremos que sea tal que donde sea normal con media y varianza . Por lo tanto, condicionado a un valor de , . Multiplique por la densidad de e integre (de a ) para encontrar el número promedio de muestras más grandes que excederá la mitad de la suma aleatoria.∑iXi=Y Y x (1−x2)N/2=Y/2 Y N/2 N/12 Y x=1−(Y/N)−−−−−−−−−√ Y Y=0 Y=N 
fuente
Supongamos que X solo tiene valores positivos para deshacerse del valor absoluto.
Sin una prueba exacta, creo que tienes que resolver k
y luego la respuesta se tomando los valores más altos de .n(1−FX(k)) 
Mi lógica es que, de forma asimétrica, la suma de todos los valores superiores a k debería ser aproximadamente
y asimétricamente la mitad de la suma total es aproximadamente
La simulación numérica muestra que el resultado se cumple para el caso uniforme (uniforme en ) donde y obtengo . No estoy seguro de si el resultado siempre se cumple o si se puede simplificar aún más, pero creo que realmente depende de la función de distribución F.F ( k ) = k k = √[0,1] F(k)=k k=(√12) 
fuente