¿Pequeños conjuntos de datos (reales) para dar ejemplos en clase?

43

Al enseñar una clase de nivel introductorio, los maestros que conozco tienden a inventar algunos números y una historia para ejemplificar el método que están enseñando.

Lo que preferiría es contar una historia real con números reales. Sin embargo, estas historias deben relacionarse con un conjunto de datos muy pequeño, que permite realizar cálculos manuales.

Cualquier sugerencia para tales conjuntos de datos será muy bienvenida.

Algunos temas de muestra para los pequeños conjuntos de datos:

  • correlación / regresión (básica)
  • ANOVA (1/2 vías)
  • Pruebas z / t: una / dos muestras no / emparejadas
  • comparaciones de proporciones - tablas de dos / múltiples vías
Tal Galili
fuente
¿Puedes definir 'pequeño'? ¿El cálculo 'manual' incluye el uso de una calculadora?
David LeBauer
Hola David - calculadora está bien - pero la idea es no tener demasiados números (ya que todos tenemos que ser escrito en la pizarra)
Tal Galili

Respuestas:

26

La biblioteca de datos e historias es una "biblioteca en línea de archivos de datos e historias que ilustran el uso de métodos básicos de estadísticas".

Este sitio parece tener lo que necesita, y puede buscarlo en conjuntos de datos particulares.

David
fuente
Hola David, el sitio al que vinculaste es realmente genial, gracias.
Tal Galili
Servicio actualmente no disponible (a partir de abril de 2016)
Felipe Almeida
@FelipeAlmeida Acabo de acceder al sitio; por favor verifique nuevamente, quizás en una computadora / dispositivo diferente
David LeBauer
@DavidLeBauer, ¿ha intentado hacer clic en "enumerar todos los temas" y luego seleccionar uno de los métodos? ver este enlace aquí
Felipe Almeida
1
@FelipeAlmeida Ya veo. Hablé con el mantenedor del sitio que dice ',,, Busque un DASL nuevo, más moderno y mucho mejor próximamente en dasl.datadesk.com'.
David LeBauer
23

Hay un libro llamado "A Handbook of Small Datasets" de DJ Hand, F. Daly, AD Lunn, KJ McConway y E. Ostrowski. El departamento de Estadística de NCSU ha publicado electrónicamente los conjuntos de datos de este libro aquí .

El sitio web anterior solo proporciona los datos; necesitaría leer el libro para obtener la historia detrás de los números, es decir, cualquier historia más allá de lo que puede deducir del título del conjunto de datos. Pero, son pequeños , y son reales .

usuario1108
fuente
Estos son del tamaño justo. Puede ver el libro buscando "Manual de pequeños conjuntos de datos" en Google Académico; puede ver partes de él en Google Books.
Felipe Almeida
El enlace dado está roto. Por favor actualice el enlace. Gracias
MYaseen208
13

Para las tablas de dos vías, me gustan los datos sobre género y supervivencia de los pasajeros titánicos:

       | Alive  Dead | Total
-------+-------------+------
Female | 308    154  |  462
Male   | 142    709  |  851
-------+-------------+------
Total  | 450    863  | 1313

Con estos datos, uno puede discutir cosas como la prueba de chi-cuadrado para la independencia y la medida de la asociación, como la tasa relativa y la razón de posibilidades. Por ejemplo, las pasajeros femeninas tenían ~ 4 veces más probabilidades de sobrevivir que los pasajeros masculinos. Al mismo tiempo, los pasajeros masculinos tenían ~ 2.5 veces más probabilidades de morir que las mujeres. Sin embargo, la razón de posibilidades de supervivencia / muerte es siempre de 10.

Wolfgang
fuente
Buena idea wolfgang, no lo pensé.
Tal Galili
(Publicar wiki comunitario en línea con todas las otras respuestas.)
Glen_b
6

CAUSAweb tiene conjuntos de datos, así como muchos otros recursos de enseñanza.

Ver http://www.causeweb.org/resources/datasets/ para los conjuntos de datos.

CAUSA significa Consorcio para el avance de la educación estadística de pregrado.

Aaron - Restablece a Monica
fuente
4

Probablemente una respuesta tan obvia que realmente no necesita mencionarse, pero para correlación o regresión lineal, el cuarteto de Anscombe es una elección lógica. Aunque no es una historia real con datos reales, creo que es un ejemplo tan simple que razonablemente encajaría en sus criterios.

Andy W
fuente
Buen ejemplo Andy: he aprendido algo nuevo hoy :)
Tal Galili
2

Un buen artículo titulado Descubrimiento de recursos para la enseñanza de estadísticas ha arrojado luz sobre este tema.

MYaseen208
fuente
Acabo de leer la mayor parte del artículo (leí algunas partes); de hecho, es una buena revisión de la situación. Será interesante ver cómo se desarrollará esto en el futuro ...
Tal Galili
2
¿Es posible que pueda agregar los puntos clave aquí, o dar un resumen? El enlace puede desaparecer en algún momento, y también ayudará a los lectores a saber si desean continuar el enlace sin tener que hacer clic en él.
gung - Restablece a Monica
1

https://tuvalabs.com

Estoy seguro de que ha encontrado lo que buscaba desde hace mucho tiempo, pero para cualquier otra persona que se encuentre con hilo, TuvaLabs es una buena fuente para los conjuntos de datos para las aulas. Cura conjuntos de datos, historia, descripción, ejercicio pequeño y capacidad de visualización, también puede solicitar conjuntos de datos en él.

Mutante
fuente