Estoy a punto de presentar la tabla normal estándar en mi clase introductoria de estadísticas, y eso me hizo preguntarme: ¿quién creó la primera tabla normal estándar? ¿Cómo lo hicieron antes de que aparecieran las computadoras? Me estremezco al pensar en alguien con fuerza bruta que calcula mil sumas de Riemann a mano.
normal-distribution
algorithms
history
tables
Daniel Smolkin
fuente
fuente
Respuestas:
Laplace fue el primero en reconocer la necesidad de tabulación, llegando a la aproximación:
La primera tabla moderna de la distribución normal fue construida posteriormente por el astrónomo francés Christian Kramp en Analyze des Réfractions Astronomiques et Terrestres (Par le citoyen Kramp, Profesor de Chymie y de Physique expérimentale à l'école centrale du Département de la Roer, 1799) . De tablas relacionadas con la distribución normal: una breve historia Autor (es): Herbert A. David Fuente: The American Statistician, vol. 59, núm. 4 (noviembre de 2005), págs. 309-311 :
Pero ... ¿qué tan preciso podría ser? Bien, tomemos2.97 como ejemplo:
¡Asombroso!
Pasemos a la expresión moderna (normalizada) del pdf gaussiano:
¡Fantástico!
Tan cerca...
La cosa es ... ¿qué tan cerca, exactamente? Después de todos los votos recibidos, no pude dejar la respuesta real pendiente. El problema era que todas las aplicaciones de reconocimiento óptico de caracteres (OCR) que probé estaban increíblemente apagadas, lo que no es sorprendente si has echado un vistazo al original. Entonces, aprendí a apreciar a Christian Kramp por la tenacidad de su trabajo mientras escribía personalmente cada dígito en la primera columna de su Table Première .
Después de una valiosa ayuda de @Glen_b, ahora puede ser muy precisa y está lista para copiar y pegar en la consola R en este enlace de GitHub .
Aquí hay un análisis de la precisión de sus cálculos. Prepárate...
mean(abs(difference))
condifference = R - kramp
:En la entrada en la que sus cálculos eran más divergentes en comparación con [R], el primer valor decimal diferente estaba en la octava posición (centésima millonésima). En promedio (mediana) su primer "error" fue en el décimo dígito decimal (¡décimo billonésimo!). Y, aunque no estuvo totalmente de acuerdo con [R] en ningún caso, la entrada más cercana no diverge hasta la entrada digital trece.
mean(abs(R - kramp)) / mean(R)
(igual queall.equal(R[,2], kramp[,2], tolerance = 0)
):sqrt(mean(difference^2))
:Si encuentra una foto o retrato de Chistian Kramp, edite esta publicación y colóquela aquí.
fuente
Según HA David [1] Laplace reconoció la necesidad de tablas de distribución normal "ya en 1783" y Kramp produjo la primera tabla normal en 1799.
Sin embargo, Kramp no usó estas series de Laplace, ya que había una brecha en los intervalos para que pudieran aplicarse de manera útil.
Para ser específicos, citando el par de frases relevantes:
David indica que las tablas fueron ampliamente utilizadas.
Entonces, en lugar de miles de sumas de Riemann, fueron cientos de expansiones de Taylor.
En una nota más pequeña, en un apuro (atascado con solo una calculadora y algunos valores recordados de la tabla normal) he aplicado con bastante éxito la regla de Simpson (y las reglas relacionadas para la integración numérica) para obtener una buena aproximación a otros valores; no es todo lo que tedioso para producir una tabla * abreviado a algunas figuras de precisión. [Sin embargo, producir tablas de la escala y precisión de Kramp sería una tarea bastante grande, incluso utilizando un método más inteligente, como lo hizo.]
* Por una tabla abreviada, me refiero a una en la que básicamente puedes salirte con la interpolación entre valores tabulados sin perder demasiada precisión. Si sólo quiere decir que alrededor de 3 numérica de precisión que realmente no es necesario calcular todos los que muchos valores. He utilizado efectivamente la interpolación polinómica (más precisamente, técnicas de diferencia finita aplicadas), lo que permite una tabla con menos valores que la interpolación lineal, si es un poco más de esfuerzo en el paso de interpolación, y también he hecho la interpolación con una transformación logit, que hace que la interpolación lineal sea mucho más efectiva, pero solo es útil si tienes una buena calculadora).
[1] Herbert A. David (2005),
"Tablas relacionadas con la distribución normal: una breve historia"
The American Statistician , vol. 59, núm. 4 (noviembre), págs. 309-311
[2] Kramp (1799),
Analyze des Réfractions Astronomiques et Terrestres,
Leipzig: Schwikkert
fuente
Cuestión interesante! Creo que la primera idea no surgió de la integración de fórmulas complejas; más bien, el resultado de aplicar los asintóticos en combinatoria. El método de lápiz y papel puede llevar varias semanas; No es tan difícil para Karl Gauss en comparación con el cálculo del pastel para sus predecesores. Creo que la idea de Gauss fue valiente; El cálculo fue fácil para él.
Ejemplo de crear una tabla z estándar desde cero-
1. Tome una población de n (digamos que n es 20) números y enumere todas las muestras posibles de tamaño r (digamos que r es 5) a partir de eso.
2. Calcule las medias muestrales. Obtiene medias de muestra nCr (aquí, 20c5 = 15504 medias).
3. Su media es la misma que la media de la población. Encuentre el estándar de medias de muestra.
4. Encuentre puntajes z de medias muestrales utilizando esas medias pop y stdev de medias muestrales.
5. Ordene z en orden ascendente y encuentre la probabilidad de que z esté en un rango en sus valores nCr z.
6. Comparar valores con tablas normales. Menor n es bueno para cálculos manuales. Mayor n producirá aproximaciones más cercanas de los valores normales de la tabla.
El siguiente código está en r:
Probabilidad de que z caiga entre 0 y el valor positivo q a continuación; comparar con una tabla conocida. Manipule q a continuación entre 0 y 3.5 para comparar.
fuente