Deje que se extraiga de una distribución t de Student con grados de libertad, para tamaño moderado (digamos menos de 100). Definir ¿Se distribuye casi como un chi-cuadrado con grados de libertad? ¿Hay algo como el Teorema del límite central para la suma de variables aleatorias al cuadrado? n n T = ∑ 1 ≤ i ≤ k t 2 i T k
chi-squared
central-limit-theorem
t-distribution
shabbychef
fuente
fuente
Respuestas:
Respondiendo la primera pregunta.
Podríamos partir del hecho señalado por mpiktas, que . Y luego intente un paso más simple al principio: busque la distribución de una suma de dos variables aleatorias distribuidas por F (1, n) . Esto podría hacerse calculando la convolución de dos variables aleatorias o calculando el producto de sus funciones características.F ( 1 , n )t2∼F(1,n) F(1,n)
El artículo de PCB Phillips muestra que mi primera suposición sobre "las funciones hipergeométricas [confluentes] involucradas" era realmente cierta. Significa que la solución no será trivial, y la fuerza bruta es complicada, pero es una condición necesaria para responder a su pregunta. Entonces, dado que es fijo y sumas las distribuciones t, no podemos decir con certeza cuál será el resultado final. A menos que alguien tenga una buena habilidad jugando con productos de funciones hipergeométricas confluentes.n
fuente
Ni siquiera es una aproximación cercana. Para pequeña , la expectativa de es igual aT k nnorte T mientras que la expectativa deχ2(k)es igual ak. Cuandokes pequeño (menos de 10, digamos), los histogramas delog(T)y delog(χ2(k))ni siquiera tienen la misma forma, lo que indica que cambiar y reescalarTtodavía no funcionará.k nn - 2 χ2( k ) k k Iniciar sesión( T) Iniciar sesión( χ2( k ) ) T
Intuitivamente, para pequeños grados de libertad, la de Student tiene una cola pesada. La cuadratura enfatiza esa pesadez. Por lo tanto, las sumas estarán más sesgadas, generalmente mucho más sesgadas, que las sumas de las normales al cuadrado (la distribución χ 2 ). Los cálculos y las simulaciones lo confirman.t χ2
Ilustración (según lo solicitado)
Tenga en cuenta que la estandarización no es posible paran < 5 n ≤ 4
fuente
fuente