¿Cuál es la explicación de su lego favorito para un concepto estadístico difícil?

36

Realmente disfruto escuchar explicaciones simples a problemas complejos ¿Cuál es su analogía o anécdota favorita que explica un concepto estadístico difícil?

Mi favorita es la explicación de Murray sobre la cointegración con un borracho y su perro. Murray explica cómo dos procesos aleatorios (un borracho errante y su perro, Oliver) pueden tener raíces unitarias pero aún estar relacionados (cointegrados) ya que sus primeras diferencias conjuntas son estacionarias.

El borracho sale del bar, a punto de vagar sin rumbo de manera aleatoria. Pero periódicamente ella entona "Oliver, ¿dónde estás?", Y Oliver interrumpe su vagar sin rumbo para ladrar. El la oye; ella lo oye. Él piensa: "Oh, no puedo dejar que se aleje demasiado; ella me encerrará". Ella piensa: "Oh, no puedo dejar que se aleje demasiado; me despertará en medio de la noche con sus ladridos". Cada uno evalúa qué tan lejos está el otro y se mueve para cerrar parcialmente esa brecha.

brotchie
fuente

Respuestas:

18

Un valor p es una medida de cuán vergonzosos son los datos para la hipótesis nula

Nicholas Maxwell, Data Matters: Estadísticas conceptuales para un mundo aleatorio Emeryville CA: Key College Publishing, 2004.

Frank Harrell
fuente
15
  1. Si esculpió su distribución (histograma) en madera e intentó equilibrarla en su dedo, el punto de equilibrio sería la media, sin importar la forma de la distribución.

  2. Si coloca un palo en el centro de su diagrama de dispersión y adjunta el palo a cada punto de datos con un resorte, el punto de descanso del palo sería su línea de regresión. [1]

[1] esto técnicamente sería una regresión de componentes principales. tendrías que forzar a los resortes a moverse solo "verticalmente" para ser mínimos cuadrados, pero el ejemplo es ilustrativo de cualquier manera.

Neil McGuigan
fuente
2
La fuerza del resorte es proporcional a la deformación, por lo que esta no es una regresión de mínimos cuadrados.
shabbychef
1
¡Buen intento! Depende de la primavera. Por ejemplo, si la constante de primavera es 1 / sigma, funciona muy bien;)
Neil McGuigan
2
L1y
L1L1
12

He usado el paseo del borracho antes para caminar al azar, y el borracho y su perro para la cointegración; son muy útiles (en parte porque son divertidos).

Uno de mis ejemplos comunes favoritos es la paradoja del cumpleaños ( entrada de wikipedia ), que ilustra algunos conceptos importantes de probabilidad. Puedes simular esto con una habitación llena de gente.

Por cierto, recomiendo encarecidamente "Enseñanza de estadísticas de Andrew Gelman : una bolsa de trucos" para ver algunos ejemplos de formas creativas de enseñar conceptos estadísticos (consulte la tabla de contenido ). Mire también su artículo sobre el curso que imparte sobre enseñanza de estadísticas: "Un curso sobre enseñanza de estadísticas a nivel universitario" . Y sobre "Enseñar a Bayes a estudiantes graduados en ciencias políticas, sociología, salud pública, educación, economía, ..." .

Para describir los métodos bayesianos, usar una moneda injusta y lanzarla varias veces es un enfoque bastante común / efectivo.

Shane
fuente
1
No existe una moneda injusta: stat.columbia.edu/~gelman/research/published/diceRev2.pdf
Tim
11

Me gusta demostrar la variación de muestreo y esencialmente el Teorema del límite central a través de un ejercicio "en clase". Todos en la clase de digamos 100 estudiantes escriben su edad en una hoja de papel. Todos los trozos de papel son del mismo tamaño y se doblan de la misma manera después de calcular el promedio. Esta es la población y calculo la edad promedio. Luego, cada alumno selecciona al azar 10 hojas de papel, anota las edades y las devuelve a la bolsa. (S) calcula la media y le pasa la bolsa al siguiente alumno. Finalmente, tenemos 100 muestras de 10 estudiantes, cada una estimando la media de la población, que podemos describir a través de un histograma y algunas estadísticas descriptivas.

Luego repetimos la demostración esta vez utilizando un conjunto de 100 "opiniones" que replican algunas preguntas de Sí / No de encuestas recientes, por ejemplo, si la elección (General Británica) fuera convocada mañana, ¿consideraría votar por el Partido Nacional Británico? Los estudiantes les dan una muestra de 10 de estas opiniones.

Al final, hemos demostrado la variación de muestreo, el Teorema del límite central, etc. con datos continuos y binarios.

Graham Cookson
fuente
10

Definitivamente el problema de Monty Hall. http://en.wikipedia.org/wiki/Monty_Hall_problem

Stephen Turner
fuente
1
+1 ese problema me retorció el cerebro cuando lo leí y pensé por primera vez, y la solución es bastante simple, pero enseña mucho sobre la probabilidad.
Sharpie
1
Me parece que el problema de Monty Hall no es más que una simple explicación de probabilidad de un laico. Lo entiendo, pero todavía tengo dificultades para entenderlo, y mucho menos entenderlo lo suficiente como para explicarlo a una persona que no es estadística y hacer que aprendan algo de él ... De todos modos, no especifique si el problema es tu concepto difícil o la explicación de tu laico . -1 hasta que lo hagas.
naught101
2
La manera fácil de explicar el problema de Monty Hall es imaginar el mismo problema pero con 1000 puertas: 999 de ellas tienen una cabra detrás de ellas y solo 1 de ellas tiene un automóvil detrás. Digamos que eliges una puerta, y el presentador del programa de juegos abre otras 998 puertas y te pregunta si quieres cambiar tu decisión a la única puerta que él no abrió. Sabiendo que no podría haber abierto la puerta con el coche detrás de él, le tiene que cambiar a la otra puerta (o ser ridículamente seguros de que usted tenía razón en su elección inicial).
Berk U.
10

1) Una buena demostración de cómo se debe definir "aleatorio" para calcular la probabilidad de ciertos eventos:

¿Cuál es la posibilidad de que una línea aleatoria dibujada a través de un círculo sea más larga que el radio?

La pregunta depende totalmente de cómo trazas tu línea. Las posibilidades que puede describir de manera real para un círculo dibujado en el suelo pueden incluir:

Dibuja dos puntos al azar dentro del círculo y dibuja una línea a través de ellos. (Vea donde caen dos moscas / piedras ...)

Elija un punto fijo en la circunferencia, luego uno aleatorio en otra parte del círculo y únase a ellos. (En efecto, esto es colocar un palo a través del círculo en un ángulo variable a través de un punto dado y uno aleatorio, por ejemplo, donde cae una piedra).

Dibuja un diámetro. Elija aleatoriamente un punto a lo largo de él y dibuje una perpendicular a través de eso. (Gire un palo en línea recta para que descanse sobre el círculo).

Es relativamente fácil mostrarle a alguien que puede hacer algo de geometría (pero no necesariamente estadísticas), la respuesta a la pregunta puede variar bastante (de aproximadamente 2/3 a aproximadamente 0.866 más o menos).

(1210)

3) Explicar por qué el diagnóstico médico puede parecer realmente defectuoso. Una prueba de detección de enfermedad que es 99.9% precisa para identificar a quienes la tienen pero .1% diagnostica falsamente a aquellos que realmente no la tienen puede parecer errónea muy a menudo cuando la prevalencia de la enfermedad es realmente baja ( por ejemplo, 1 de cada 1000), pero muchos pacientes se hacen la prueba.

Este es uno que se explica mejor con números reales: imagine que 1 millón de personas se hacen la prueba, por lo que 1000 tienen la enfermedad, 999 están correctamente identificadas, pero el 0.1% de 999,000 es 999 a quienes se les dice que la tienen pero no la tienen. Entonces, la mitad de los que se les dice que la tienen en realidad no la tienen, a pesar del alto nivel de precisión (99.9%) y el bajo nivel de falsos positivos (0.1%). Una segunda prueba (idealmente diferente) separará estos grupos.

[Por cierto, elegí los números porque son fáciles de trabajar, por supuesto, no tienen que sumar hasta el 100% ya que la precisión / tasas de falsos positivos son factores independientes en la prueba.]

AdamV
fuente
2
Creo que su primer ejemplo se refiere a la paradoja de Bertrand. ¡Muy buena ilustración de las diferentes formas de definir un espacio probabilístico!
chl
9

El libro de Sam Savage, La falla de los promedios, está lleno de buenas explicaciones de conceptos estadísticos. En particular, tiene una buena explicación de la desigualdad de Jensen. Si el gráfico de su rendimiento de una inversión es convexo, es decir, "le sonríe", entonces la aleatoriedad está a su favor: su rendimiento promedio es mayor que su rendimiento promedio.

John D. Cook
fuente
6

Behar et al tienen una colección de 25 analogías para enseñar estadísticas. Aquí hay dos ejemplos:

2.9 Todos los modelos son teóricos: No hay esferas perfectas en el universo Parece que la forma geométrica más común en el universo es la esfera. Pero, ¿cuántas esferas matemáticamente perfectas hay en el universo? La respuesta es ninguna. Ni la Tierra, ni el Sol, ni una bola de billar son una esfera perfecta. Entonces, si no hay esferas verdaderas, ¿de qué sirven las fórmulas para determinar el área o el volumen de una esfera? Lo mismo ocurre con los modelos estadísticos en general y, en particular, con una distribución normal. Aunque uno de los ejemplos más comunes es la distribución de altura, si tuviéramos a nuestra disposición la altura de cada adulto en el planeta, el perfil de histograma no correspondería a una curva de campana gaussiana, ni siquiera si los datos se estratificaran por género, raza, o cualquier otra característica.

2.25 Los residuos no deben contener información: los residuos de una bolsa de basura son los que quedan después de eliminar toda la información de los datos. Como no deben llevar información, los consideramos como "basura". Es necesario asegurarse de no tirar ninguna basura que tenga valor (información) y que pueda explotarse para explicar mejor el comportamiento de la variable dependiente.

Otros ejemplos incluyen

  • "Efecto del tamaño de la muestra en la comparación de tratamientos: ampliación de binoculares"
  • "El tamaño de la muestra versus el tamaño de la población: una cuchara para probar la sopa"

Referencias

  • Behar, R., Grima, P. y Marco-Almagro, L. (2012). Veinticinco analogías para explicar conceptos estadísticos. El estadístico estadounidense, (recién aceptado).
Jeromy Anglim
fuente
3

Pregunta divertida

Alguien descubrió que trabajo en bioestadística y me preguntaron (básicamente) "¿No son las estadísticas solo una forma de mentir?"

(Lo que trae de vuelta la cita de Mark Twain sobre mentiras, malditas mentiras y estadísticas).

Traté de explicar que las estadísticas nos permiten decir con una precisión del 100 por ciento que, dados los supuestos y los datos dados, que la probabilidad de tal y tal era exactamente tal y tal.

Ella no estaba impresionada.

Mike Dunlavey
fuente
1
"Nos permite decir, con 100% de precisión, exactamente cuán grande es nuestra falta de precisión"
nada101
If not an outright refutation, @Jeromy's answer suggests why the "100% precision" notion should be scrapped.
rolando2