¿Cuál es la suma de las variables t al cuadrado?

20

Deje que se extraiga de una distribución t de Student con grados de libertad, para tamaño moderado (digamos menos de 100). Definir ¿Se distribuye casi como un chi-cuadrado con grados de libertad? ¿Hay algo como el Teorema del límite central para la suma de variables aleatorias al cuadrado? n n T = 1 i k t 2 i T ktinn

T=1ikti2
Tk
shabbychef
fuente
@suncoolsu: dice 'casi' ...
shabbychef
mis disculpas. No vi eso.
suncoolsu

Respuestas:

14

Respondiendo la primera pregunta.

Podríamos partir del hecho señalado por mpiktas, que . Y luego intente un paso más simple al principio: busque la distribución de una suma de dos variables aleatorias distribuidas por F (1, n) . Esto podría hacerse calculando la convolución de dos variables aleatorias o calculando el producto de sus funciones características.F ( 1 , n )t2F(1,n)F(1,n)

El artículo de PCB Phillips muestra que mi primera suposición sobre "las funciones hipergeométricas [confluentes] involucradas" era realmente cierta. Significa que la solución no será trivial, y la fuerza bruta es complicada, pero es una condición necesaria para responder a su pregunta. Entonces, dado que es fijo y sumas las distribuciones t, no podemos decir con certeza cuál será el resultado final. A menos que alguien tenga una buena habilidad jugando con productos de funciones hipergeométricas confluentes.n

Dmitrij Celov
fuente
2
+1 para el enlace, no sabía que la función característica de la distribución F era tan complicada.
mpiktas
14

Ni siquiera es una aproximación cercana. Para pequeña , la expectativa de es igual aT k nnorteT mientras que la expectativa deχ2(k)es igual ak. Cuandokes pequeño (menos de 10, digamos), los histogramas delog(T)y delog(χ2(k))ni siquiera tienen la misma forma, lo que indica que cambiar y reescalarTtodavía no funcionará.knortenorte-2χ2(k)kkIniciar sesión(T)Iniciar sesión(χ2(k))T

Intuitivamente, para pequeños grados de libertad, la de Student tiene una cola pesada. La cuadratura enfatiza esa pesadez. Por lo tanto, las sumas estarán más sesgadas, generalmente mucho más sesgadas, que las sumas de las normales al cuadrado (la distribución χ 2 ). Los cálculos y las simulaciones lo confirman.tχ2


Ilustración (según lo solicitado)

texto alternativo

norteknorte=9999χ2Tχ2

Tenga en cuenta que la estandarización no es posible para norte<5 5norte4 4

whuber
fuente
Tenía miedo de eso, pero pensé que la suma traería algunas colas.
shabbychef
nortekχ2(k)k(norte)knorte
@Dmitrij Las simulaciones son rápidas (lleva más tiempo dibujar los histogramas), así que agregué 12 de ellas.
whuber
+1 para la figura. Las ilustraciones siempre son agradables de ver.
Dmitrij Celov
7

k

T-kmi(t1)2kVunar(t12)norte(0 0,1)

mit12Vunar(t12)nortet121norte

Tknn2k2n2(n1)(n2)2(n4)N(0,1)

mpiktas
fuente
1
T ^ 2 de Hotelling: (f - d + 1) / fd T ^ 2 ∼ F (d, f + 1 - d)
DWin
1
T2TT2 . ¿Puedes por favor dar más detalles sobre esto?
mpiktas
F(1,norte)+F(1,norte)
Creo que se reduce a su situación cuando la matriz de varianza es diagonal. Los elementos fuera de la diagonal de una muestra deberían estar cerca de cero si las muestras eran de Normal, pero podrían no ser exactamente cero si son de t. No obstante, solicitó algo aproximado, por lo que creo que la respuesta es probablemente F bajo esa condición.
DWin
F(1,norte)F