Datos de cambio de moneda de John Kerrich

12

¿Alguien puede sugerir dónde obtener los resultados de las 10,000 monedas lanzadas (es decir, las 10,000 caras y colas) realizadas por John Kerrich durante la Segunda Guerra Mundial?

Thomas
fuente
1
Dado que estaba encerrado en una prisión nazi en ese momento, me pregunto si tenía suficiente papel para registrar todos los resultados de 10k, o si solo escribió los valores resumidos.
Corone
66
Los resultados de @Corone 10K podrían registrarse fácilmente en una hoja de papel estándar utilizando, por ejemplo, un punto y un código de barras (como en ||||..|....||.|..||.etc.). Esto se puede comprimir usando (por ejemplo) hexadecimal. En el ejemplo anterior, dejando |ser 1 y .ser 0, la representación hexadecimal es f21a6. Al escribir caracteres pequeños pero visibles, puedo colocar fácilmente 50 de esos caracteres en una línea de escritura y 50 líneas en una hoja, lo que representa una secuencia de 50 * 50 * 4 = 10K resultados.
whuber
2
@whuber jaja, sí, comencé a reflexionar sobre cosas similares después de mi comentario. Dudo que en la era anterior a la computadora, hexadecimal hubiera surgido a la mente como lo hace ahora, aunque octal aún le daría una oportunidad. Aún así lo intenté y solo con puntos y rayas podría obtener más de 100 en una hoja, por lo que si usara ambos lados, 10K encajaría. ¡Quizás por eso se detuvo en 10K!
Corone
Una prisión nazi, sí, pero en Dinamarca, no era un campo de exterminio ...
kjetil b halvorsen
@kjetilbhalvorsen - en realidad un campo de prisioneros danés en Hald con guardias daneses, etc. para proteger a los internos de los alemanes
Henry

Respuestas:

13

No había oído hablar de Kerrich antes, qué historia tan extraña. El escaneo de libros de Google (compartido por reftt) de "Una introducción experimental a la teoría de la probabilidad" no parece incluir el cuerpo del texto. Sintiéndome un poco anticuado, saqué una copia de la edición de 1950 de la biblioteca.

He escaneado algunas páginas que me parecieron interesantes. Las páginas describen sus condiciones de prueba, datos de los primeros 2000 lanzamientos de monedas y datos de los primeros 500 de una serie de 5000 experimentos de urna que suenan igualmente inverosímiles (con 2 pelotas de ping pong rojas y 2 verdes).


El reconocimiento de texto (y algo de limpieza) usando Mathematica 9 proporciona esta secuencia de 2000 colas (0) y cabezas (1) de la Tabla 1. El recuento de cabezas de 1014 es uno más que 502 + 511 = 1013 en la Tabla 2, por lo que el reconocimiento fue imperfecto, pero se ve bastante bien, ¡al menos tiene el número correcto de caracteres! (Los lectores de ojos agudos están invitados a corregirlo).

Aquí hay un resumen gráfico de esta caminata aleatoria, seguido de los datos mismos. La diferencia acumulada entre los recuentos de cabeza y cola procede de izquierda a derecha, cubriendo todos los resultados de 2000.

Figura

00011101001111101000110101111000100111001000001110
00101010100100001001100010000111010100010000101101
01110100001101001010000011111011111001101100101011
01010000011000111001111101101010110100110110110110
01111100001110110001010010000010100111111011101011
10001100011000110001100110100100001000011101111000
11111110000000001101011010011111011110010010101100
11101101110010000010001100101100111110100111100010
00001001101011101010110011111011001000001101011111
11010001111110010111111001110011111111010000100000
00001111100101010111100001110111001000110100001111
11000101001111111101101110110111011010010110110011
01010011011111110010111000111101111111000001001001
01001110111011011011111100000101010101010101001001
11101101110011100000001001101010011001000100001100
10111100010011010110110111001101001010100000010000
00001011001101011011111000101100101000011100110011
11100101011010000110001001100010010001100100001001
01000011100000011101101111001110011010101101001011
01000001110110100010001110010011100001010000000010
10010001011000010010100011111101101111010101010000
01100010100000100000000010000001100100011011101010
11011000110111010110010010111000101101101010110110
00001011011101010101000011100111000110100111011101
10001101110000010011110001110100001010000111110100
00111111111111010101001001100010111100101010001111
11000110101010011010010111110000111011110110011001
11111010000011101010111101101011100001000101101001
10011010000101111101111010110011011110000010110010
00110110101111101011100101001101100100011000011000
01010011000110100111010000011001100011101011100001
11010111011110101101101111001111011100011011010000
01011110100111011001001110001111011000011110011111
01101011101110011011100011001111001011101010010010
10100011010111011000111110000011000000010011101011
10001011101000101111110111000001111111011000000010
10111111011100010000110000110001111101001110110000
00001111011100011101010001011000110111010001110111
10000010000110100000101000010101000101100010111100
00101110010111010010110010110100011000001110000111
Bill Bradley
fuente
3
De nada. Superpuse un gráfico de estos datos en su imagen escaneada, con la esperanza de que pudiera hacer obvias las discrepancias, pero no puedo encontrar ninguna diferencia. O no hay errores y Kerrich contó mal o simplemente no puedo encontrar el error, pero en cualquier caso los datos publicados aquí son una representación de texto precisa de su Tabla 1.
whuber
4

Esta presentación muestra los datos para establecer intervalos de lanzamientos. También hace referencia a la fuente primaria de Kerrich.


fuente
2
La fuente de los datos (resumen) en esa presentación son las estadísticas de Freedman, Pisani y Purves (cualquier edición). Sin embargo, es solo un resumen, no una cuenta de todos los resultados solicitados aquí. Kerrich publicó sus resultados en 1946 en un pequeño libro; Google lo ha digitalizado .
whuber
Como dije, tiene datos para "intervalos de lanzamiento" y la presentación hace referencia a la monografía de Kerrich donde publicó sus resultados. No sé si Kerrich publicó su lista de cada lanzamiento. Pensé que esto era al menos más útil que solo la proporción general.
@whuber: sí, esa fue la monografía mencionada en la presentación. Parece tener disponibilidad limitada. ¿Alguien ha encontrado un pdf?
2

Hay otra referencia de Kerrich en el libro "Encuentros casuales: un primer curso en análisis de datos e inferencia" de Chris Wild y George Seber que dice en el capítulo 4 (puede descargar el suplemento de esta página ) que los datos se publican en Kerrich [1964] y Freedman [1991, Tabla 1, p. 248]. El libro de Kerrich es probablemente una introducción experimental a la teoría de la probabilidad , y Freedman es el mismo libro de texto ya mencionado. Sin embargo, dudo que la monografía de 1964 contenga más datos que la de 1946.

reftt
fuente
2

Ese libro de Kerrich se puede comprar usado en Amazon, ¡pero el precio cotizado es bastante rígido!

Una mejor opción es https://openlibrary.org
. Debe crear una cuenta allí, luego instalar Adobe Digital Editions para leer el libro. (parece que ningún otro programa lo hará, el libro descargado tiene DRM, gestión de restricciones digitales). Luego puede descargar ("pedir prestado") el libro. Lo estoy leyendo justo ahora. Supongo que puedo tomar una copia de pantalla de las páginas con los resultados, y usar ocr en eso. Para luego ...

(No, he revisado rápidamente el libro, parece que solo los primeros 2000 lanzamientos se dan individualmente, pero hay muchas tablas diversas con resúmenes de los lanzamientos. También hay tablas para algunos otros experimentos, como sacar bolas de una urna , en el mismo espíritu.

kjetil b halvorsen
fuente
3
No está claro si ha notado que los primeros 2000 resultados individuales ya están disponibles en este hilo en la respuesta de Bill Bradley . El libro aparece en los libros de Google; Proporcioné un enlace en otro comentario . Actualmente, Google enlaza con otros libreros, además de Amazon, donde el precio cotizado (incluido el envío) es considerablemente más barato.
whuber
Gracias, noté los lanzamientos de 2000 donde estaban disponibles arriba, pero esperaba poder encontrar más en el libro. Parece que no. No puedo leer el libro a través de google books, ¿tal vez ese acceso depende de la geografía? Por cierto, ahora
devolví
1
Intenté lo mismo cuando apareció este hilo, con los mismos resultados negativos. :-( No quise decir que en realidad podemos leer la versión en los libros de Google: solo se puede buscar. El principal valor de GB (al menos hasta que la política de Google cambie) es proporcionar enlaces a lugares donde podríamos comprarlo.
whuber
1

Me encontré con esto cuando hice una investigación de antecedentes sobre Kerrich. Tomé los datos de la respuesta de Bill Bradley, ¡ realmente aprecio que los datos hayan sido digitalizados! He agregado los datos al paquete R que uso para la enseñanza, que está disponible en GitHub .

Chris Prener
fuente