Distribución de la suma de cuadrados de variables aleatorias distribuidas en T

11

Estoy mirando la distribución de la suma de cuadrados de variables aleatorias distribuidas en T, con exponente de cola . Donde X es el rv, la transformada de Fourier para , me da una solución para el cuadrado antes de la convolución . αX2F(t)F(t)n

F(t)=0exp(itx2)((αα+x2)α+12α B(α2,12))dx

Con , la solución es posible pero difícil de manejar e imposible de invertir para hacer un Fourier inverso para . Entonces la pregunta es: ¿se ha trabajado en la distribución de la varianza muestral o la desviación estándar de las variables aleatorias distribuidas en T? (Sería para el StudentT lo que el Chi-cuadrado es para el Gaussiano). Gracias.α=3F(t)n

(Posible solución) Descubrí que es Fisher distribuido, por lo tanto, veré la suma de las variables distribuidas de Fisher.X2F(1,α)

(Solución posible) A partir de las funciones características, el promedio de sumado tiene los mismos dos primeros momentos de una distribución cuando existen. Por lo tanto, con u la raíz cuadrada y haciendo un cambio de variable dentro de una distribución de probabilidad, la densidad de la desviación estándar de las variables T de n-muestra se puede aproximar con: nX2F(n,α)

g(u)=2αα/2nn/2un1(α+nu2)α2n2B(n2,α2)
Nerón
fuente
1
T2 es distribuido. La media y la varianza de una suma de variables independientes distribuidas en se deriva fácilmente, pero la distribución no está disponible en forma cerrada. Vea esta pregunta para algunos detalles. Puede encontrar útil el documento vinculado. La función característica también se da en la página de Wikipedia para el F. [La varianza de la muestra de variables t-distribuido es una pregunta bastante diferente.]FF(1,α)
Glen_b -Reinstate Monica

Respuestas:

7

Una aclaración de su pregunta (me parece que hay dos partes relacionadas, pero diferentes): está buscando (1) distribución de una suma de variables aleatorias al cuadrado independientes , y (2) el muestreo distribución de la varianza (o la desviación estándar relacionada) de una muestra aleatoria extraída de una distribución (presumiblemente su razón para preguntar sobre (1)).n tαtα

Distribución de la suma de variables cuadradas independientestα

Si son variables aleatorias (independientes) con df, entonces es falso que (que es lo que parece reclamar en su segunda "posible solución"). Esto se verifica fácilmente considerando el primer momento de cada uno (el primer momento de este último es veces el primero). Titαtαi=1nTi2F(n,α)n

La afirmación en su primera "posible solución" es correcta: . En lugar de recurrir a funciones características, creo que este resultado es más transparente al considerar la caracterización de la distribución como la distribución de la relación donde es una variable normal estándar y es una variable chi-cuadrado con grados de libertad, independientemente de . El cuadrado de esta razón es entonces la razón de dos variables chi-cuadrado independientes escaladas por sus respectivos grados de libertad, es decir, conTi2F(1,α)tZU/αZUαZV/1U/αV=Z2, que es una caracterización estándar de una distribución (con el numerador df igual a 1 y el denominador df igual a ).F(1,α)α

Teniendo en cuenta la nota que hice en los primeros momentos en el primer párrafo anterior, podría parecer que una mejor afirmación puede ser que [Tengo notación ligeramente abusada aquí usando la misma expresión para la distribución, así como una variable aleatoria que tenga esa distribución.]. Mientras que los primeros momentos coinciden, los segundos momentos centrales no (para la varianza de la primera expresión es menor que la varianza de la última expresión), por lo que esta afirmación también es falsa. [Dicho esto, es interesante observar que , que es el resultado que esperamos al sumar al cuadrado (estándar) variantes normales.]i=1nTi2nF(n,α)α>4limαnF(n,α)=χn2

Muestreo de distribución de varianza al muestrear desde una distribucióntα

Teniendo en cuenta lo que he escrito anteriormente, la expresión que obtiene para "la densidad de la desviación estándar de las variables T de n muestras" es incorrecta. Sin embargo, incluso si fuera la distribución correcta, la desviación estándar no es simplemente la raíz cuadrada de la suma de cuadrados (como parece haber utilizado para llegar a su densidad ). En su lugar, estaría buscando la distribución de muestreo (a escala) de . En el caso normal, el LHS de esta expresión puede reescribirse como una suma de variables normales al cuadrado (el término dentro del cuadrado puede reescribirse como una combinación lineal de variables normales que nuevamente se distribuye normalmente) que conduce a la familiarF(n,α)g(u)i=1n(TiT¯)2=i=1nTi2nT¯2χ2 distribución. Desafortunadamente, una combinación lineal de variables (incluso con los mismos grados de libertad) no se distribuye como , por lo que no se puede explotar un enfoque similar.tt

¿Quizás debería volver a considerar qué es lo que desea demostrar? Puede ser posible lograr el objetivo utilizando algunas simulaciones, por ejemplo. Sin embargo, sí indica un ejemplo con , una situación en la que solo el primer momento de es finito, por lo que la simulación no ayudará con tales cálculos de momento. α=3F(1,α)

Mark D
fuente
Gracias Mark; de hecho, la convolución se rompe aunque se preservan los dos primeros momentos. Intentará Chi-cuadrado y revertirá.
Nero
Reformulé mi pregunta. ¿O debería publicar modificaciones en otra parte de la página?
Nero
Nero: los cambios en su pregunta deben aparecer en la pregunta. Siempre puede indicar cómo cambió la pregunta en la pregunta si eso ayuda (aunque tenga en cuenta que todo el historial de edición de la pregunta y las respuestas está disponible si es necesario).
Glen_b -Reinstate Monica