Prueba de ji cuadrado de dos muestras

10

Esta pregunta es del libro Asymptotic Statistics de Van der Vaart, pág. 253. # 3:

Suponga que y son vectores multinomiales independientes con parámetros y . Bajo la hipótesis nula de que muestra queXmYn(m,a1,,ak)(n,b1,,bk)ai=bi

χ 2 k - 1 c i=(Xm,i+Yn,i)/(m+n)

i=1k(Xm,imc^i)2mc^i+i=1k(Yn,inc^i)2nc^i
tiene . donde .χk12c^i=(Xm,i+Yn,i)/(m+n)

Necesito ayuda para comenzar. ¿Cuál es la estrategia aquí? Pude combinar los dos sumandos en:

i=1k(mYn,inXm,i)2mn(m+n)c^i

pero esto no funcionará con el CLT porque es una combinación ponderada de e . No estoy seguro si este es el camino correcto. ¿Alguna sugerencia?XmYn

EDITAR: si entonces es bastante fácil porque obtenemosm=n

mYnnXmmn(m+n)=YnXm(m+n)

donde el numerador puede verse como una suma de diferencias de variables Multinomiales para que podamos aplicar CLT y luego terminarlo con el Teorema 17.2 de ese mismo capítulo. Sin embargo, no puedo entender cómo hacer que esto funcione en esta situación con diferentes tamaños de muestra. ¿Alguna ayuda?(1,a1,,ak)

Un enlace al capítulo 17 de Google Books de van der Vaart

bdeonovic
fuente

Respuestas:

6

Primero alguna notación. Deje que y denoten la secuencia categórica asociada con y , es decir, . Deje . Considere las binerizaciones donde es el Delta de Kronecker. Entonces tenemos{ Y t } 1 , ... , n X m Y nPr { X t =i } =ai,Pr { Y t =i } =biN=n+m X yo{Xt}1,,m{Yt}1,,nXmYnPr{Xt=i}=ai,Pr{Yt=i}=biN=n+m

Xi=(X1,i,,XN,i)=(δi,X1,,δi,Xn,0,,0)Yi=(Y1,i,,YN,i)=(0,,0,δi,Y1,,δi,Yn)
δi,j1i=j
Xm,i=t=1NXt,i=t=1mδi,XtYn,i=t=1NYt,i=t=1nδi,Yt

Ahora comenzamos la prueba. Primero combinamos los dos sumandos de la estadística de prueba. Tenga en cuenta que Para que podamos escribir la estadística de prueba como

Xm,imc^i=(n+m)Xm,im(Xm,i+Yn,i)n+m=nXm,imYn,in+mYn,inc^i=(n+m)Yn,in(Xm,i+Yn,i)n+m=mYn,inXm,in+m
S=i=1k(Xm,imc^i)2mc^i+i=1k(Yn,inc^i)2nc^i=i=1k(nXm,imYn,i)2(n+m)2mc^i+i=1k(nXm,imYn,i)2(n+m)2nc^i=i=1k(nXm,imYn,i)2nm(n+m)c^i

Siguiente nota que con el siguientes propiedades

nXm,imYn,i=t=1NnXt,imYt,i=Zi
E[Zi]=nE[Xm,i]mE[Yn,i]=nmainmai=0Var[Zi]=Var[nXm,imYn,i]=n2Var[Xm,i]m2Var[Yn,i]Note Xm,i and Yn,i are independent=n2mai(1ai)+m2nai(1ai)=nm(n+m)ai(1ai)Cov[Zi,Zj]=E[ZiZj]E[Zi]E[Zj]=E[(nXm,imYn,i)(nXm,jmYn,j)]=n2(maiaj+m2aiaj)2n2m2aiaj+m2(naiaj+n2aiaj)=nm(n+m)aiaj

y por CLT multivariante tenemos donde el elemento th de , . Dado que Por Slutsky tenemos donde es la matriz de identidad ,

1nm(n+m)Z=nXmmYnnm(n+m)DN(0,Σ)
(i,j)Σσij=ai(δijaj)c^=(c^1,,c^k)p(a1,,ak)=a
nXmmYnnm(n+m)c^DN(0,Ikaa)
Ikk×ka=(a1,,ak) . Como tiene un valor propio 0 de multiplicidad 1 y un valor propio 1 de multiplicidad , según el teorema de mapeo continuo (o vea Lema 17.1, Teorema 17.2 de van der Vaart) tenemosk-1 k i=1(n X m , i -m Y n , i ) 2Ikaak1
i=1k(nXm,imYn,i)2nm(n+m)c^iDχk12
bdeonovic
fuente