¿Por qué las pruebas de chi-cuadrado usan el recuento esperado como la varianza?

18

En las pruebas , ¿cuál es la base para usar la raíz cuadrada de los recuentos esperados como las desviaciones estándar (es decir, los recuentos esperados como las variaciones) de cada una de las distribuciones normales? Lo único que pude encontrar discutiendo esto es http://www.physics.csbsju.edu/stats/chi-square.html , y solo menciona las distribuciones de Poisson.χ2

Como una simple ilustración de mi confusión, ¿qué pasaría si estuviéramos probando si dos procesos son significativamente diferentes, uno que genera 500 As y 500 Bs con una variación muy pequeña, y el otro que genera 550 As y 450 Bs con una variación muy pequeña (rara vez genera 551 As y 449 Bs)? ¿No es la varianza aquí claramente no simplemente el valor esperado?

(No soy un estadístico, así que realmente estoy buscando una respuesta que sea accesible para el no especialista).

Yang
fuente
Esto probablemente tenga algo que ver con el hecho de que la varianza de una variable aleatoria es y también con el hecho de que la estadística debe multiplicarse por 2 para tener la distribución correcta (como en el prueba de razón de probabilidad). Quizás alguien sepa sobre esto más formalmente. χk22k
Macro

Respuestas:

16

La forma general de muchas estadísticas de prueba es

observedexpectedstandarderror

En el caso de una variable normal, el error estándar se basa en la varianza de la población conocida (estadísticas z) o en la estimación de la muestra (estadísticas t). Con el binomio, el error estándar se basa en la proporción (proporción hipotética para las pruebas).

En una tabla de contingencia, puede considerarse que el conteo en cada celda proviene de una distribución de Poisson con una media igual al valor esperado (debajo del valor nulo). La varianza para la distribución de Poisson es igual a la media, por lo que también utilizamos el valor esperado para el cálculo del error estándar. He visto una estadística que usa lo observado en su lugar, pero tiene menos justificación teórica y no converge tan bien con la .χ2

Greg Snow
fuente
1
Me estoy estancando en la conexión con el Poisson / entiendo por qué cada celda puede considerarse como proveniente de un Poisson. Sé la media / varianza de Poissons, y sé que representan la cantidad de eventos dada una tasa. También sé que las distribuciones de chi-cuadrado representan la suma de cuadrados de las normales estándar (varianza 1). Solo estoy tratando de entender la justificación de reutilizar el valor esperado como una suposición de la "propagación" de cada una de las normales. ¿Es esto solo para hacer que todo se ajuste a la distribución chi-cuadrado / a "estandarizar" las normales?
Yang
3
Hay un par de problemas, la distribución de Poisson es común para los recuentos cuando las cosas son bastante independientes. En lugar de pensar que la tabla tiene un total fijo y está distribuyendo los valores entre las celdas de la tabla, piense solo en una celda de la tabla y espere un tiempo fijo para ver cuántas respuestas caen en esa celda , esto encaja con la idea general del Poisson. Para medios grandes, puede aproximar un Poisson con una distribución normal, por lo que el estadístico de prueba tiene sentido como una aproximación normal al Poisson, luego convertir a . χ2
Greg Snow
1
(+1) Suponga que los recuentos de celdas eran variables aleatorias de Poisson independientes con media n π i . Entonces, ciertamente, k i = 1 ( X i - n π i ) 2Xi,,Xknπi en distribución. Pero, el problema con esto es quenes unparámetroy no los conteos reales observados. Los recuentos totales observados sonN= k i = 1 XiPoi(n). AunqueN/n1 escasi seguro por el SLLN, hay que trabajar un poco más para convertir la heurística en algo viable. i=1k(Xinπi)2nπiχk2nN=i=1kXiPoi(n)N/n1
cardenal
Como una simple ilustración de mi confusión, ¿qué pasaría si estuviéramos probando si dos procesos son significativamente diferentes, uno que genera 500 As y 500 Bs con una variación muy pequeña, y el otro que genera 550 As y 450 Bs con una variación muy pequeña (rara vez genera 551 As y 449 Bs)? ¿No es la variación aquí claramente no simplemente el valor esperado?
Yang
1
@Yang: Parece que sus datos, que no ha descrito, no se ajustan al modelo subyacente al uso de la estadística de chi-cuadrado. El modelo estándar es uno de muestreo multinomial . Estrictamente hablando, ni siquiera se cubre el muestreo de Poisson (incondicional), que es lo que supone la respuesta de Greg. Hago una referencia (tal vez obtusa) a esto en mi comentario anterior.
cardenal
17

Manejemos el caso más simple para tratar de proporcionar la mayor intuición. Sea una muestra iid de una distribución discreta con k resultados. Sea π 1 , ... , π k las probabilidades de cada resultado particular. Estamos interesados ​​en la distribución (asintótica) de la estadística de chi-cuadrado X 2 = k i = 1 ( S i - n π i ) 2X1,X2,,Xnkπ1,,πk Aquí n π i es el número esperado de los cargos de la i ª resultado.

X2=i=1k(Sinπi)2nπi.
nπii

Una sugerente heurística

Definir , de modo queX2=iU 2 i =U 2 2 dondeU=(U1,,Uk).Ui=(Sinπi)/nπiX2=iUi2=U22U=(U1,,Uk)

Como es B i n ( n , π i ) , entonces por el Teorema del límite central , T i = U iSiBin(n,πi) por lo tanto, también tenemos que, U i d N ( 0 , 1 - π i ) .

Ti=Ui1πi=Sinπinπi(1πi)dN(0,1),
UidN(0,1πi)

Ahora, si la fueron (asintóticamente) independiente (que no lo son), entonces se podría argumentar que Σ i T 2 i era asintóticamente χ 2 k distribuye. Pero, tenga en cuenta que T k es una función determinista de ( T 1 , ... , T k - 1 ) y, por lo tanto, las variables T i no pueden ser independientes.TiiTi2χk2Tk(T1,,Tk1)Ti

Por lo tanto, debemos tener en cuenta la covarianza entre ellos de alguna manera. Resulta que la forma "correcta" de hacer esto es usar lugar, y la covarianza entre los componentes de U también cambia la distribución asintótica de lo que podríamos haber pensado que era χ 2 k a lo que, de hecho, es a χ 2 k - 1 .UiUχk2χk12

Algunos detalles sobre esto siguen.

Un tratamiento más riguroso.

No es difícil comprobar que, de hecho, paraij.Cov(Ui,Uj)=πiπjij

Entonces, la covarianza de es A = I - U donde

A=IππT,
. Tenga en cuenta que Aes simétrica y idempotente, es decir,A=A2=AT. Entonces, en particular, siZ=(Z1,,Zk)tiene iid componentes normales estándar, entoncesAZN(0,A). (Nota: la distribución normal multivariada en este caso esdegenerada).π=(π1,,πk)AA=A2=ATZ=(Z1,,Zk)AZN(0,A)

Ahora, por el multivariado teorema del límite central , el vector de tiene una distribución asintótica normal multivariante con media 0 y covarianza A .U0A

Entonces, tiene la misma distribución asintótica que A Z , por lo tanto, la misma distribución asintótica de X 2 = U T U es la misma que la distribución de Z T A T A Z = Z T A Z por el teorema de mapeo continuo .UAZX2=UTUZTATAZ=ZTAZ

Arank(A)AA=QDQTQDrank(A)

ZTAZχk12Ak1

Otras conexiones

La estadística de chi-cuadrado también está estrechamente relacionada con las estadísticas de razón de probabilidad. De hecho, es una estadística de puntuación Rao y puede verse como una aproximación de la serie Taylor de la estadística de razón de probabilidad.

Referencias

Este es mi propio desarrollo basado en la experiencia, pero obviamente influenciado por textos clásicos. Buenos lugares para buscar para aprender más son

  1. GAF Seber y AJ Lee (2003), Análisis de regresión lineal , 2ª ed., Wiley.
  2. E. Lehmann y J. Romano (2005), Prueba de hipótesis estadísticas , 3ª ed., Springer. Sección 14.3 en particular.
  3. DR Cox y DV Hinkley (1979), Estadísticas teóricas , Chapman y Hall.
cardenal
fuente
(+1) Creo que es difícil encontrar esta prueba en textos estándar de análisis de datos categóricos como Agresti, A. (2002). Análisis de datos categóricos. John-Wiley
suncoolsu
Gracias por el comentario. Sé que hay un tratamiento de la estadística de chi-cuadrado en Agresti, pero no recuerdo cuán lejos lo lleva. Puede apelar a la equivalencia asintótica con la estadística de razón de probabilidad.
cardenal
k1
XS