En las pruebas , ¿cuál es la base para usar la raíz cuadrada de los recuentos esperados como las desviaciones estándar (es decir, los recuentos esperados como las variaciones) de cada una de las distribuciones normales? Lo único que pude encontrar discutiendo esto es http://www.physics.csbsju.edu/stats/chi-square.html , y solo menciona las distribuciones de Poisson.
Como una simple ilustración de mi confusión, ¿qué pasaría si estuviéramos probando si dos procesos son significativamente diferentes, uno que genera 500 As y 500 Bs con una variación muy pequeña, y el otro que genera 550 As y 450 Bs con una variación muy pequeña (rara vez genera 551 As y 449 Bs)? ¿No es la varianza aquí claramente no simplemente el valor esperado?
(No soy un estadístico, así que realmente estoy buscando una respuesta que sea accesible para el no especialista).
Respuestas:
La forma general de muchas estadísticas de prueba es
En el caso de una variable normal, el error estándar se basa en la varianza de la población conocida (estadísticas z) o en la estimación de la muestra (estadísticas t). Con el binomio, el error estándar se basa en la proporción (proporción hipotética para las pruebas).
En una tabla de contingencia, puede considerarse que el conteo en cada celda proviene de una distribución de Poisson con una media igual al valor esperado (debajo del valor nulo). La varianza para la distribución de Poisson es igual a la media, por lo que también utilizamos el valor esperado para el cálculo del error estándar. He visto una estadística que usa lo observado en su lugar, pero tiene menos justificación teórica y no converge tan bien con la .χ2
fuente
Manejemos el caso más simple para tratar de proporcionar la mayor intuición. Sea una muestra iid de una distribución discreta con k resultados. Sea π 1 , ... , π k las probabilidades de cada resultado particular. Estamos interesados en la distribución (asintótica) de la estadística de chi-cuadrado X 2 = k ∑ i = 1 ( S i - n π i ) 2X1,X2,…,Xn k π1,…,πk
Aquí n π i es el número esperado de los cargos de la i ª resultado.
Una sugerente heurística
Definir , de modo queX2=∑iU 2 i =‖U‖ 2 2 dondeU=(U1,…,Uk).Ui=(Si−nπi)/nπi−−−√ X2=∑iU2i=∥U∥22 U=(U1,…,Uk)
Como es B i n ( n , π i ) , entonces por el Teorema del límite central , T i = U iSi Bin(n,πi)
por lo tanto, también tenemos que, U i d → N ( 0 , 1 - π i ) .
Ahora, si la fueron (asintóticamente) independiente (que no lo son), entonces se podría argumentar que Σ i T 2 i era asintóticamente χ 2 k distribuye. Pero, tenga en cuenta que T k es una función determinista de ( T 1 , ... , T k - 1 ) y, por lo tanto, las variables T i no pueden ser independientes.Ti ∑iT2i χ2k Tk (T1,…,Tk−1) Ti
Por lo tanto, debemos tener en cuenta la covarianza entre ellos de alguna manera. Resulta que la forma "correcta" de hacer esto es usar lugar, y la covarianza entre los componentes de U también cambia la distribución asintótica de lo que podríamos haber pensado que era χ 2 k a lo que, de hecho, es a χ 2 k - 1 .Ui U χ2k χ2k−1
Algunos detalles sobre esto siguen.
Un tratamiento más riguroso.
No es difícil comprobar que, de hecho, parai≠j.Cov(Ui,Uj)=−πiπj−−−−√ i≠j
Entonces, la covarianza de es A = I - √U
donde √
Ahora, por el multivariado teorema del límite central , el vector de tiene una distribución asintótica normal multivariante con media 0 y covarianza A .U 0 A
Entonces, tiene la misma distribución asintótica que A Z , por lo tanto, la misma distribución asintótica de X 2 = U T U es la misma que la distribución de Z T A T A Z = Z T A Z por el teorema de mapeo continuo .U AZ X2=UTU ZTATAZ=ZTAZ
Otras conexiones
La estadística de chi-cuadrado también está estrechamente relacionada con las estadísticas de razón de probabilidad. De hecho, es una estadística de puntuación Rao y puede verse como una aproximación de la serie Taylor de la estadística de razón de probabilidad.
Referencias
Este es mi propio desarrollo basado en la experiencia, pero obviamente influenciado por textos clásicos. Buenos lugares para buscar para aprender más son
fuente