Estoy mirando la distribución de la suma de cuadrados de variables aleatorias distribuidas en T, con exponente de cola . Donde X es el rv, la transformada de Fourier para , me da una solución para el cuadrado antes de la convolución .
Con , la solución es posible pero difícil de manejar e imposible de invertir para hacer un Fourier inverso para . Entonces la pregunta es: ¿se ha trabajado en la distribución de la varianza muestral o la desviación estándar de las variables aleatorias distribuidas en T? (Sería para el StudentT lo que el Chi-cuadrado es para el Gaussiano). Gracias.
(Posible solución) Descubrí que es Fisher distribuido, por lo tanto, veré la suma de las variables distribuidas de Fisher.
(Solución posible) A partir de las funciones características, el promedio de sumado tiene los mismos dos primeros momentos de una distribución cuando existen. Por lo tanto, con u la raíz cuadrada y haciendo un cambio de variable dentro de una distribución de probabilidad, la densidad de la desviación estándar de las variables T de n-muestra se puede aproximar con:
fuente
Respuestas:
Una aclaración de su pregunta (me parece que hay dos partes relacionadas, pero diferentes): está buscando (1) distribución de una suma de variables aleatorias al cuadrado independientes , y (2) el muestreo distribución de la varianza (o la desviación estándar relacionada) de una muestra aleatoria extraída de una distribución (presumiblemente su razón para preguntar sobre (1)).n tα tα
Distribución de la suma de variables cuadradas independientestα
Si son variables aleatorias (independientes) con df, entonces es falso que (que es lo que parece reclamar en su segunda "posible solución"). Esto se verifica fácilmente considerando el primer momento de cada uno (el primer momento de este último es veces el primero).Ti∼tα t α ∑ni=1T2i∼F(n,α) n
La afirmación en su primera "posible solución" es correcta: . En lugar de recurrir a funciones características, creo que este resultado es más transparente al considerar la caracterización de la distribución como la distribución de la relación donde es una variable normal estándar y es una variable chi-cuadrado con grados de libertad, independientemente de . El cuadrado de esta razón es entonces la razón de dos variables chi-cuadrado independientes escaladas por sus respectivos grados de libertad, es decir, conT2i∼F(1,α) t ZU/α√ Z U α Z V/1U/α V=Z2 , que es una caracterización estándar de una distribución (con el numerador df igual a 1 y el denominador df igual a ).F(1,α) α
Teniendo en cuenta la nota que hice en los primeros momentos en el primer párrafo anterior, podría parecer que una mejor afirmación puede ser que [Tengo notación ligeramente abusada aquí usando la misma expresión para la distribución, así como una variable aleatoria que tenga esa distribución.]. Mientras que los primeros momentos coinciden, los segundos momentos centrales no (para la varianza de la primera expresión es menor que la varianza de la última expresión), por lo que esta afirmación también es falsa. [Dicho esto, es interesante observar que , que es el resultado que esperamos al sumar al cuadrado (estándar) variantes normales.]∑ni=1T2i∼nF(n,α) α>4 limα→∞nF(n,α)=χ2n
Muestreo de distribución de varianza al muestrear desde una distribucióntα
Teniendo en cuenta lo que he escrito anteriormente, la expresión que obtiene para "la densidad de la desviación estándar de las variables T de n muestras" es incorrecta. Sin embargo, incluso si fuera la distribución correcta, la desviación estándar no es simplemente la raíz cuadrada de la suma de cuadrados (como parece haber utilizado para llegar a su densidad ). En su lugar, estaría buscando la distribución de muestreo (a escala) de . En el caso normal, el LHS de esta expresión puede reescribirse como una suma de variables normales al cuadrado (el término dentro del cuadrado puede reescribirse como una combinación lineal de variables normales que nuevamente se distribuye normalmente) que conduce a la familiarF(n,α) g(u) ∑ni=1(Ti−T¯)2=∑ni=1T2i−nT¯2 χ2 distribución. Desafortunadamente, una combinación lineal de variables (incluso con los mismos grados de libertad) no se distribuye como , por lo que no se puede explotar un enfoque similar.t t
¿Quizás debería volver a considerar qué es lo que desea demostrar? Puede ser posible lograr el objetivo utilizando algunas simulaciones, por ejemplo. Sin embargo, sí indica un ejemplo con , una situación en la que solo el primer momento de es finito, por lo que la simulación no ayudará con tales cálculos de momento.α=3 F(1,α)
fuente
Es posible que desee consultar la distribución T de Hotelling ( http://en.wikipedia.org/wiki/Hotelling's_T-squared_distribution ). Hay relaciones con siendo una distribución ( http://en.wikipedia.org/wiki/F-distribution#Related_distributions_and_properties ), pero no estoy seguro de que esto sea exactamente lo que está pidiendo.T2 F
fuente