¿Por qué los grados de libertad para un par emparejado prueban el número de pares menos 1?

9

Estoy acostumbrado a conocer los "grados de libertad" como , donde tienes el modelo lineal \ mathbf {y} = \ mathbf {X} \ boldsymbol {\ beta} + \ boldsymbol {\ epsilon} con \ mathbf {y } \ in \ mathbb {R} ^ n , \ mathbf {X} \ in M_ {n \ times p} (\ mathbb {R}) la matriz de diseño con rango r , \ boldsymbol {\ beta} \ in \ mathbb { R} ^ p , \ boldsymbol {\ epsilon} \ in \ mathbb {R} ^ n con \ boldsymbol {\ epsilon} \ sim \ mathcal {N} (\ mathbf {0}, \ sigma ^ 2 \ mathbf {I} _n) , \ sigma ^ 2> 0 .nr

y=Xβ+ϵ
yRnXMn×p(R)rβRpϵRnϵN(0,σ2In)σ2>0

Por lo que recuerdo de las estadísticas elementales (es decir, modelos pre-lineales con álgebra lineal), los grados de libertad para la prueba t de pares coincidentes tes el número de diferencias menos 1 . Entonces esto implicaría que X tenga rango 1, tal vez. ¿Es esto correcto? Si no, ¿por qué es n1 los grados de libertad para la prueba t de pares emparejados t?

Para comprender el contexto, supongamos que tengo un modelo de efectos mixtos

yijk=μi+ some random effects+eijk
donde i=1,2 , j=1,,8 y k=1,2 . No hay nada especial sobre μi aparte de que es un efecto fijo, y eijkiidN(0,σe2) . Supongo que los efectos aleatorios son irrelevantes para este problema, ya que solo nos preocupamos por los efectos fijos en este caso.

Me gustaría proporcionar un intervalo de confianza para μ1μ2 .

Ya he demostrado que d¯=18dj es un estimador imparcial de μ1μ2 , donde dj=y¯1jy¯2j , y¯1j=12ky1jk y y¯21 se define de manera similar. Se calculó la estimación puntual d¯ .

Ya he demostrado que

sd2=j(djd¯)281
es un estimador imparcial de la varianza de dj , y por lo tanto,
sd28
es el error estándar de d¯ . Esto ha sido calculado.

Ahora la última parte es descubrir los grados de libertad. Para este paso, generalmente trato de encontrar la matriz de diseño, que obviamente tiene rango 2, pero tengo la solución a este problema, y ​​dice que los grados de libertad son .81

En el contexto de encontrar el rango de una matriz de diseño, ¿por qué los grados de libertad son ?81

Editado para agregar: Quizás útil en esta discusión es cómo se define la estadística de prueba. Supongamos que tengo un vector de parámetros . En este caso, (a menos que me falte algo por completo). Básicamente estamos realizando la prueba de hipótesis where . Luego, el estadístico de prueba viene dado por que se probaría contra una distribución central conβ

β=[μ1μ2]
cβ=0
c=[11]
t=cβ^σ^2c(XX)1c
tnrgrados de libertad, donde es la matriz de diseño como arriba, y donde .X
σ^2=y(IPX)ynr
PX=X(XX)1X
Clarinetista
fuente

Respuestas:

5

La prueba pares emparejados con pares es en realidad solo una prueba una muestra con una muestra de tamaño . Tiene diferencias , y estas son iid y normalmente se distribuyen. La primera columna después de tienetntnnd1,,dn

[d1dn]=[d¯d¯]+[d1d¯d1d¯]n d.f.1 d.f.(n1) d.f.
=''1grado de libertad debido a la restricción lineal que dice que todas las entradas son iguales; el segundo tiene grados de libertad debido a la restricción lineal que dice que la suma de las entradas es .n10
Michael Hardy
fuente
En otras palabras, la razón por la que tenemos grados de libertad aquí no tiene nada que ver con el modelo lineal ? n1y=Xβ+ϵ
Clarinetista
1
Tiene que ver con ese modelo, donde la matriz es una columna de sy es una matriz cuya única entrada es la diferencia entre las dos medias de población. X1β1×1
Michael Hardy
2
¡Ajá! Entonces, su sería ese vector de s, ¿correcto? ¡Muchas gracias! ¡No puedo creer lo difícil que ha sido encontrar una respuesta sobre esto! ydi
Clarinetista
Si. Es el vector de las diferencias observadas en los pares emparejados. n
Michael Hardy
2

Muchas, muchas gracias a Michael Hardy por responder mi pregunta.

La idea es esta: let y . Entonces nuestro modelo lineal es entonces donde es el vector de todos, y Obviamente tiene rango , entonces tenemos grados de libertad .

y=[d1dn]
β=[μ1μ2]
y=1n×1β+ϵ
1n×1n
ϵ=[ϵ1ϵn]N(0,σ2In).
X=1n×11n1

¿Cómo sabemos establecer igual a ? Recuerde que y como se puede ver fácilmente, para todos . Dado nuestro , es obvio lo que debería ser . Esto es porque β[μ1μ2]

E[y]=Xβ
E[dj]=μ1μ2jXβ
E[y]=E[[d1dn]]=[E[d1]E[dn]]=[μ1μ2μ1μ2]=Xβ=1n×1β=[11]β
so debe ser una matriz con .β1×1β=[μ1μ2]

Establezca . Entonces nuestra prueba de hipótesis es Nuestra estadística de prueba es, por lo tanto, Tenemos Después de algún trabajo, se puede demostrar que También se puede demostrar quec=[1]

H0:cβ=0.
cβ^σ^2c(XX)1c.
σ^2=y(IPX)ynr(X).
PX=P1n×1=1n×1(1n)1.
IPXEs simétrico e idempotente. Entonces, y
σ^2=y(IPX)ynr(X)=y(IPX)(IPX)ynr(X)=(IPX)y2nr(X)=[I1n×1(1n)1]y2n1=[d1dn][d¯d¯]2n1=i=1n(did¯)2n1=sd2
XX=1n×11n×1=n
que obviamente tiene inversa , dando así una estadística de prueba que se probaría en una distribución central con grados de libertad como se desee.1/n
μ^1μ^2sd2/n
tn1
Clarinetista
fuente