¿Cuál es la distribución de la diferencia de dos distribuciones t?

19

... y por qué ?

Suponiendo que , son variables aleatorias independientes con media y varianza respectivamente. Mi libro de estadísticas básicas me dice que la distribución de tiene las siguientes propiedades:X 2 μ 1 , μ 2 σ 2 1 , σ 2 2 X 1 - X 2X1X2μ1,μ2σ12,σ22X1X2

  • E(X1X2)=μ1μ2
  • Var(X1X2)=σ12+σ22

Ahora digamos , son distribuciones t con , grados de libertad. ¿Cuál es la distribución de ?X1X2n1-1n2-2X1-X2

Esta pregunta ha sido editada: la pregunta original era "¿Cuáles son los grados de libertad de la diferencia de dos distribuciones t?" . mpiktas ya ha señalado que esto no tiene sentido ya que no está distribuido en t, sin importar cuán aproximadamente normal sea (es decir, df alto).X1-X2X1,X2

steffen
fuente
1
Esta es una pregunta relacionada que podría ser de interés.
mpiktas
2
Busque en Google la prueba t de Satterthwaite, la prueba t de CABF (aproximación de Cochran al Behrens-Fisher) y el problema de Behrens-Fisher.
whuber
3
Para el caso especial donde los grados de libertad son 1 (la distribución de Cauchy) la respuesta a la pregunta original es 1. La suma (o diferencia) de dos variables aleatorias distribuidas de Cauchy independientes es Cauchy con el parámetro de escala , pero nuevamente, el La distribución de Cauchy ni siquiera tiene un valor medio. 2
NRH
1
Debe verificar la distribución Behrens-Fisher
Wis

Respuestas:

15

La suma de dos variables aleatorias independientes distribuidas en t no está distribuida en t. Por lo tanto, no puede hablar sobre los grados de libertad de esta distribución, ya que la distribución resultante no tiene ningún grado de libertad en el sentido que tiene la distribución t.

mpiktas
fuente
@mpiktas: pregunta tonta. Si la distribución t con n-1 df puede derivarse de la suma de n distribuciones normales independientes (ver wikipedia) y darse df lo suficientemente alto como para que la distribución t se aproxime a la distribución normal, no se deriva de eso que la suma de las distribuciones t es nuevamente una distribución t?
steffen
@mpiktas: ¿Qué pasa con la estadística de prueba de la prueba t, que parece derivarse de la diferencia de dos distribuciones t?
steffen
1
@steffen, no. Será aproximadamente normal, ya que agregará dos variables normales distribuidas aproximadamente normales. La distribución t con df alta es aproximadamente normal, pero aproximadamente normal no es necesariamente la distribución t con df alta.
mpiktas
1
@steffen, el estadístico de la prueba t se deriva de la diferencia de dos normales y no de dos distribuciones t. Tenga en cuenta que la definición de la distribución t es una fracción de la raíz normal y cuadrada de chi-cuadrado.
mpiktas
1
@steffen, a menudo les digo a mis alumnos que no hay preguntas estúpidas, solo personas estúpidas que no hacen preguntas. No soy un profesor muy popular, debo agregar :)
mpiktas
4

De acuerdo con las respuestas anteriores, la diferencia de dos variables aleatorias independientes distribuidas en t no está distribuida en t. Pero quiero agregar algunas formas de calcular esto.

  1. La forma más fácil de calcular esto es usando un método de Monte Carlo. En R, por ejemplo, muestras aleatoriamente 100,000 números de la primera distribución t, luego muestras aleatoriamente otros 100,000 números de la segunda distribución t. Dejas que el primer conjunto de 100,000 números menos el segundo conjunto de 100,000 números. Los 100,000 números nuevos obtenidos son muestras aleatorias de la distribución de la diferencia entre las dos distribuciones. Puede calcular la media y la varianza simplemente usando mean()y var().

    1. Esto se llama distribución Behrens-Fisher. Puede consultar la página Wiki: https://en.wikipedia.org/wiki/Behrens%E2%80%93Fisher_distribution . El IC dado por esta distribución se llama "intervalo fiducial", este no es un IC .

    2. La integración numérica podría funcionar. Esto continúa como la viñeta 2. Puede referirse a la Sección 2.5.2 en Inferencia Bayesiana en Análisis Estadístico por Box, George EP, Tiao, George C. Tiene los pasos detallados de integración, y cómo se aproxima esto a una distribución Behrens-Fisher.

Shijia Bian
fuente
1
Me parece que la distribución Behrens-Fisher se aplica cuando la varianza de las dos distribuciones t no es igual. ¿Se puede decir lo mismo si la varianza de las dos distribuciones ES igual?
Ian Sudbery
1
Lo siento, presionó enter dos temprano? Para continuar ... Por ejemplo, digamos que tenemos dos distribuciones normales de varianza igual pero desconocida, pero con medios diferentes. Extraemos dos muestras de cada una de estas distribuciones. La diferencia de medias entre las dos muestras de la misma distribución seguirá una distribución t, pero cuál es la distribución de la diferencia de las diferencias.
Ian Sudbery