¿Cómo llegó Pearson con las siguientes estadísticas chi-cuadrado de Pearson en 1900?
que K∼χ2
¿Tenía en mente chi cuadrado e ideó la métrica (enfoque de abajo hacia arriba), o ideó la estadística y luego demostró que sigue la distribución de chi cuadrado (de arriba hacia abajo)?
Quiero saber por qué eligió esa forma específica y no otras como o ∑ | O i j - E i j | , y también por qué dividió el cuadrado con el denominador.
Respuestas:
El artículo de Pearson 1900 no tiene derechos de autor, por lo que podemos leerlo en línea .
Debe comenzar señalando que este documento trata sobre la bondad de la prueba de ajuste, no la prueba de independencia u homogeneidad.
Continúa trabajando con la normal multivariada, y el chi-cuadrado surge como una suma de variables normales estandarizadas al cuadrado.
Puede ver en la discusión en p160-161 que está discutiendo claramente la aplicación de la prueba a datos distribuidos multinomiales (no creo que use ese término en ninguna parte). Aparentemente entiende la normalidad multivariada aproximada del multinomio (ciertamente sabe que los márgenes son aproximadamente normales, ese es un resultado muy antiguo, y conoce los medios, las variaciones y las covarianzas, ya que se indican en el documento); Supongo que la mayoría de esas cosas ya son viejas para 1900. (Tenga en cuenta que la distribución de chi-cuadrado en sí se remonta al trabajo de Helmert a mediados de la década de 1870).
Luego, al final de p163, deriva una estadística de chi-cuadrado como "una medida de bondad de ajuste" (la estadística en sí misma aparece en el exponente de la aproximación normal multivariada).
* (tenga en cuenta que no existen los paradigmas de prueba de Fisherian o Neyman-Pearson, sin embargo, vemos claramente que ya aplica el concepto de un valor p).
Gran parte de la forma actual de entender la prueba de chi-cuadrado aún no está en su lugar, pero por otro lado, ya existe bastante (al menos si sabe qué buscar). Mucho sucedió en la década de 1920 (y en adelante) que cambió la forma en que vemos estas cosas.
Agregado en edición:
El artículo de 1983 de Plackett ofrece una buena cantidad de contexto histórico y una especie de guía para el artículo. Recomiendo echarle un vistazo. Parece que es gratis en línea a través de JStor (si inicia sesión), por lo que ni siquiera debería necesitar acceso a través de una institución para leerlo.
Plackett, RL (1983),
"Karl Pearson y la prueba de Chi-cuadrado"
International Statistical Review ,
vol. 51, núm. 1 (abril), págs. 59-72
fuente