Estrategias para enseñar la distribución muestral

30

La versión tl; dr ¿Qué estrategias exitosas empleas para enseñar la distribución de muestreo (de una media muestral, por ejemplo) en un nivel introductorio de pregrado?

El fondo

En septiembre, enseñaré un curso introductorio de estadística para estudiantes de segundo año de ciencias sociales (principalmente ciencias políticas y sociología) usando La práctica básica de estadística de David Moore. Será la quinta vez que enseñe este curso y un problema que siempre he tenido es que los estudiantes realmente han tenido problemas con la noción de distribución de muestreo . Está cubierto como fondo para la inferencia y sigue una introducción básica a la probabilidad con la que no parecen tener problemas después de algunos contratiempos iniciales (y por básico, quiero decir básico- después de todo, muchos de estos estudiantes se han seleccionado a sí mismos en un curso específico porque intentaban evitar cualquier cosa, incluso con una vaga pista de "matemáticas"). Supongo que probablemente el 60% abandone el curso sin una comprensión mínima, aproximadamente el 25% entiende el principio pero no las conexiones con otros conceptos, y el 15% restante entiende completamente.

El problema principal

El problema que los estudiantes parecen tener es con la aplicación. Es difícil explicar cuál es el problema exacto además de decir que simplemente no lo entienden. De una encuesta que realicé el semestre pasado y de las respuestas del examen, creo que parte de la dificultad es la confusión entre dos frases sonoras relacionadas y similares (distribución de muestreo y distribución de muestra), por lo que no utilizo la frase "distribución de muestra" ya, pero seguramente esto es algo que, aunque es confuso al principio, se comprende fácilmente con un poco de esfuerzo y, de todos modos, no puede explicar la confusión general del concepto de distribución de muestreo.

(¡Me doy cuenta de que podríamos ser yo y mi enseñanza lo que está en juego aquí! Sin embargo, creo que ignorar esa incómoda posibilidad es razonable, ya que algunos estudiantes parecen entenderlo y, en general, todo el mundo parece estar bastante bien ...)

Lo que he intentado

Tuve que discutir con el administrador de pregrado en nuestro departamento para presentar sesiones obligatorias en el laboratorio de computación pensando que las demostraciones repetidas podrían ser útiles (antes de comenzar a enseñar este curso no había computación involucrada). Si bien creo que esto ayuda a la comprensión general del material del curso en general, no creo que haya ayudado con este tema específico.

Una idea que he tenido es simplemente no enseñarla o no darle mucho peso, una posición defendida por algunos (por ejemplo, Andrew Gelman ). No me parece particularmente satisfactorio, ya que tiene el olfato de enseñar al mínimo común denominador y, lo que es más importante, niega a los estudiantes fuertes y motivados que desean aprender más sobre la aplicación estadística al comprender realmente cómo funcionan los conceptos importantes (¡no solo la distribución de muestreo! ) Por otro lado, el estudiante medio parece comprender los valores p, por ejemplo, por lo que tal vez no es necesario que comprendan la distribución de muestreo de todos modos.

La pregunta

¿Qué estrategias emplea para enseñar la distribución de muestreo? Sé que hay materiales y debates disponibles (por ejemplo, aquí y aquí y este documento que abre un archivo PDF ), pero me pregunto si puedo obtener algunos ejemplos concretos de lo que funciona para las personas (o supongo que incluso lo que no funciona ¡así que sabré no intentarlo!). Mi plan ahora, como planeo mi curso para septiembre, es seguir el consejo de Gelman y "enfatizar" la distribución de muestreo. Lo enseñaré, pero les aseguraré a los estudiantes que este es un tipo de tema solo para su información y que no aparecerá en un examen (¡¿excepto tal vez como una pregunta adicional ?!). Sin embargo, estoy realmente interesado en escuchar otros enfoques que la gente ha usado.

smillig
fuente
También puede hacer esto con distribuciones de población no normales para mostrar el teorema del límite central
user41270
lo siento, esto debería haber sido un comentario en mi respuesta a continuación.
user41270

Respuestas:

23

En mi opinión, las distribuciones de muestreo son la idea clave de las estadísticas 101. Es mejor omitir el curso como omitir ese tema. Sin embargo, estoy muy familiarizado con el hecho de que los estudiantes simplemente no lo entienden, aparentemente sin importar lo que hagas. Tengo una serie de estrategias. Estos pueden tomar mucho tiempo, pero recomiendo omitir / abreviar otros temas, para asegurarse de que tengan la idea de la distribución del muestreo. Aquí hay algunos consejos:

  • Dígalo claramente: Primero menciono explícitamente que hay 3 distribuciones diferentes que nos preocupan: la distribución de la población, la distribución de la muestra y la distribución de muestreo. Digo esto una y otra vez a lo largo de la lección, y luego una y otra vez a lo largo del curso. Cada vez que digo que estos términos hacen hincapié en la final distintiva: SAM- plo , samp- ling . (Sí, los estudiantes se cansan de esto; también captan el concepto).
  • Usar imágenes (figuras): tengo un conjunto de figuras estándar que uso cada vez que hablo sobre esto. Tiene las tres distribuciones representadas de manera distinta, y típicamente etiquetadas. (Las etiquetas que van con esta figura están en la diapositiva de PowerPoint e incluyen descripciones cortas, por lo que no aparecen aquí, pero obviamente es: población en la parte superior, luego muestras, luego distribución de muestreo).
    ingrese la descripción de la imagen aquí
  • Ofrezca actividades a los estudiantes: la primera vez que presente este concepto, traiga un rollo de monedas de cinco centavos (algunos cuartos pueden desaparecer) o un montón de dados de 6 lados. Haga que los estudiantes se formen en pequeños grupos y generen un conjunto de 10 valores y promedien. Luego puede hacer un histograma en el tablero o con Excel.
  • Usar animaciones (simulaciones): escribo un código (cómicamente ineficiente) en R para generar datos y mostrarlos en acción. Esta parte es especialmente útil cuando hace la transición para explicar el Teorema del límite central. (Observe las Sys.sleep()declaraciones, estas pausas me dan un momento para explicar lo que está sucediendo en cada etapa).
N = 10
number_of_samples = 1000


iterations  = c(3, 7, number_of_samples)  
breakpoints = seq(10, 91, 3)  
meanVect    = vector()  
x           = seq(10, 90)  
height      = 30/dnorm(50, mean=50, sd=10)  
y           = height*dnorm(x, mean=50, sd=10)  

windows(height=7, width=5)  
par(mfrow=c(3,1), omi=c(0.5,0,0,0), mai=c(0.1, 0.1, 0.2, 0.1))  

for(i in 1:iterations[3]) {  
  plot(x,y, type="l", col="blue", axes=F, xlab="", ylab="")  
  segments(x0=20, y0=0, x1=20, y1=y[11], col="lightgray")  
  segments(x0=30, y0=0, x1=30, y1=y[21], col="gray")  
  segments(x0=40, y0=0, x1=40, y1=y[31], col="darkgray")  
  segments(x0=50, y0=0, x1=50, y1=y[41])  
  segments(x0=60, y0=0, x1=60, y1=y[51], col="darkgray")  
  segments(x0=70, y0=0, x1=70, y1=y[61], col="gray")  
  segments(x0=80, y0=0, x1=80, y1=y[71], col="lightgray")  
  abline(h=0)  

  if(i==1) {  
    Sys.sleep(2)  
  }  
  sample = rnorm(N, mean=50, sd=10)  
  points(x=sample, y=rep(1,N), col="green", pch="*")  

  if(i<=iterations[1]) {  
    Sys.sleep(2)  
  }  
  xhist1 = hist(sample, breaks=breakpoints, plot=F)  
  hist(sample, breaks=breakpoints, axes=F, col="green", xlim=c(10,90),  
       ylim=c(0,N), main="", xlab="", ylab="")  
  if(i==iterations[3]) {  
    abline(v=50)  
  }  

  if(i<=iterations[2]) {  
    Sys.sleep(2)  
  }  
  sampleMean = mean(sample)  
  segments(x0=sampleMean, y0=0, x1=sampleMean,   
           y1=max(xhist1$counts)+1, col="red", lwd=3)  

  if(i<=iterations[1]) {  
    Sys.sleep(2)  
  }  
  meanVect = c(meanVect, sampleMean)  
  hist(meanVect, breaks=x, axes=F, col="red", main="",   
       xlab="", ylab="", ylim=c(0,((N/3)+(0.2*i))))  
  if(i<=iterations[2]) {  
    Sys.sleep(2)  
  }  
}  

Sys.sleep(2)  
xhist2 = hist(meanVect, breaks=x, plot=F)  
xMean  = round(mean(meanVect), digits=3)  
xSD    = round(sd(meanVect), digits=3)  
histHeight = (max(xhist2$counts)/dnorm(xMean, mean=xMean, sd=xSD))  
lines(x=x, y=(histHeight*dnorm(x, mean=xMean, sd=xSD)),   
      col="yellow", lwd=2)  
abline(v=50)  

txt1 = paste("population mean = 50     sampling distribution mean = ",  
             xMean, sep="")  
txt2 = paste("SD = 10     10/sqrt(", N,") = 3.162     SE = ", xSD,  
            sep="")  
mtext(txt1, side=1, outer=T)  
mtext(txt2, side=1, line=1.5, outer=T)  
  • Restablezca estos conceptos a lo largo del semestre: cada vez que hablamos sobre el siguiente tema vuelvo a plantear la idea de la distribución de la muestra (aunque generalmente solo muy brevemente). El lugar más importante para esto es cuando enseña ANOVA, ya que el caso de la hipótesis nula realmente es la situación en la que tomó muestras de la misma distribución de población varias veces, y su conjunto de grupos significa que realmente es una distribución de muestreo empírica. (Para ver un ejemplo de esto, vea mi respuesta aquí: ¿Cómo funciona el error estándar? )
gung - Restablece a Monica
fuente
1
Esta es una buena respuesta (+1). Especialmente creo que las actividades y simulaciones son muy útiles para enseñar esta materia. En un curso introductorio que enseñé algunas veces, utilizamos un applet web que permitía a los estudiantes visualizar cómo se calcula la estadística a partir de la muestra y cómo el histograma de la distribución de muestreo comienza a tomar forma a medida que repite esto muchas veces. Creo que la actividad ayudó mucho más que cualquier cosa que les dije a los estudiantes cuando se trataba de comprender las distribuciones de muestreo :)
Macro
+1 Gracias Gung, ¡esa es una gran respuesta! Gracias por "enviarme el codez" también (nb. Los usuarios de Mac reemplazan windows(...)con quartz(...)) Su punto sobre reforzar el concepto durante todo el semestre es particularmente útil. Creo que seguir estas pautas será realmente útil.
smillig
(+1) para el mantra de "3 distribuciones" y para la imagen relacional. Nadie puede entender un concepto sin comprender primero que es, de hecho, un concepto distinto .
Alecos Papadopoulos
He encontrado la página del " libro de estadísticas en línea " de la Universidad de Rice sobre la distribución de muestras muy útil para esto. La versión original, de muchos años, presentaba un applet de Java, pero estoy encantado de que lo hayan rehecho recientemente en Javascript. La forma en que funciona es esencialmente idéntica a su diagrama.
Silverfish
8

He tenido suerte al recordarles a los estudiantes que la distribución de muestreo es la distribución del estadístico de prueba basado en una muestra aleatoria . Les pido a los estudiantes que piensen en lo que sucedería en el proceso de muestreo en sí mismo, y se centraría en casos extremos. Por ejemplo, ¿cómo sería la "distribución de muestreo" si nuestro proceso de muestreo siempre eligiera el mismo subconjunto (especial). Entonces consideraría cómo sería la "distribución de muestreo" si nuestro proceso de muestreo solo escogiera dos subconjuntos específicos (especiales) (cada uno con probabilidad 1/2). Estos son bastante simples de resolver con la media muestral (especialmente para elecciones particulares de "especial" para la población subyacente).

Creo que para algunos (claramente no todos) los estudiantes esto parece ayudarlos con la idea de que la distribución de muestreo puede ser muy diferente de la distribución de la población. También he usado el ejemplo del teorema del límite central que Michael Chernick mencionó con cierto éxito, especialmente con distribuciones que claramente no son normales (las simulaciones realmente parecen ayudar).

shoda
fuente
Graham Cookson tiene un buen ejercicio de clase que se publica como respuesta en "¿Cuál es la explicación de su lego favorito para un concepto estadístico difícil?" - Un wiki de la comunidad.
shoda
+1, es una buena idea hablar sobre la distribución muestral de muestras no aleatorias.
gung - Restablecer Monica
+1 ¡Gran idea sobre la selección de subconjuntos! Creo que este es el enlace al que te refieres @shoda: stats.stackexchange.com/a/554/9249
smillig
7

Comienzo de nuevo con la enseñanza de la probabilidad. No profundizo en muchas de las definiciones y reglas formales (solo que no tengo suficiente tiempo), pero muestro la probabilidad por simulación. El problema de Monty Hall es un gran ejemplo para usar, muestro a través de la simulación (y luego el seguimiento con la lógica) que la estrategia para cambiar da una mayor probabilidad de ganar. Señalo que por simulación pudimos jugar muchas veces (sin riesgo ni recompensa) para evaluar las estrategias y eso nos permite elegir la mejor estrategia (si alguna vez nos encontramos en esa situación). Elegir la mejor estrategia no garantiza una victoria, pero nos da una mejor oportunidad y nos ayuda a elegir entre estrategias. Luego señalo que cómo esto se aplicará al resto del curso es que nos ayudará a elegir estrategias donde haya un componente aleatorio,

Luego, cuando presento la distribución de muestreo, nuevamente comienzo con la simulación y digo que queremos desarrollar estrategias. Al igual que con el problema de Monty Hall, en la vida real solo podremos tomar 1 muestra, pero podemos simular un montón de muestras para ayudarnos a desarrollar una estrategia. Luego muestro simulaciones de muchas muestras de la misma población (población conocida en este caso) y muestro las relaciones que aprendemos de las simulaciones (histograma de las medias muestrales), es decir, medias muestrales agrupadas alrededor de la media verdadera (la media de las medias es media) , menor desviación estándar de distribución de muestreo para muestras más grandes, más normal para muestras más grandes. Todo el tiempo hablo de repetir las ideas de simulación para elegir estrategias, exactamente la misma idea que el problema de Monty Hall aplicado ahora a los medios de muestra en lugar de los programas de juegos. Luego muestro las reglas oficiales y digo que, además de las simulaciones, pueden demostrarse matemáticamente, pero no infligiré las pruebas a toda la clase. Les ofrezco que si realmente quieren ver las pruebas matemáticas, pueden acudir a una hora de oficina y les mostraré las matemáticas (nadie de las clases de introducción me ha abordado sobre esto todavía).

Luego, cuando llegamos a la inferencia, digo que solo podremos tomar 1 muestra en el mundo real, al igual que solo podríamos jugar el juego 1 vez (como máximo), pero podemos usar las estrategias que aprendimos al simular muchas muestras para desarrollar una estrategia (prueba z, prueba t o fórmula CI) que nos dará las propiedades elegidas (posibilidad de ser correctas). Al igual que con el juego, no sabemos antes de comenzar si nuestra conclusión final será correcta (y, por lo general, aún no lo sabemos después), pero sí sabemos por las simulaciones y la distribución de muestreo qué está usando la probabilidad a largo plazo Esa estrategia.

¿El 100% de los estudiantes tienen una comprensión perfecta? no, pero creo que más de ellos tienen la idea general de que podemos usar reglas de simulación y matemáticas (que están contentos de no tener que mirar, solo confíen en el libro / instructor) para elegir una estrategia / fórmula que tenga propiedades deseadas

Greg Snow
fuente
+1 Gracias por compartir este consejo. Creo que lo resolvió con el problema de ser el vínculo entre lo que podemos enseñar sobre cuál es la distribución de muestreo y cómo se puede extrapolar a la inferencia de una sola muestra. Como usted (y otros aquí) han sugerido, es importante continuar reiterando el concepto una y otra vez a lo largo del curso, pero no lo hago con frecuencia (al menos no por mí, probablemente porque ya me resulta lo suficientemente difícil encajar en todo lo que quiero, ¡mucho menos volviendo a los conceptos ya cubiertos!).
smillig
3

Este es un tema muy importante y bien pensado de su parte. Creo que el concepto de distribución de muestreo es básico para comprender la inferencia y definitivamente debe enseñarse.

He enseñado muchos cursos introductorios de estadística, particularmente en bioestadística. Enseño el concepto de distribución de muestreo y tengo enfoques que creo que son buenos, pero realmente no tengo buenos comentarios para determinar qué tan exitoso he sido con ellos. De todos modos aquí es lo que hago.

Primero trato de dar una definición simple. La distribución de muestreo es la distribución que tendría el estadístico de prueba si el proceso de muestreo se repitiera muchas veces. Depende de la distribución de la población a partir de la cual se supone que se generan los datos.

Aunque creo que esta es una definición tan simple como puedo darme cuenta, no es muy simple y la comprensión del concepto no llegará de inmediato en la mayoría de los casos. Entonces, siga con un ejemplo básico que refuerce lo que se dice con la definición.

22

Luego seguiría esto con una aplicación importante, el teorema del límite central. En los términos más simples, el teorema del límite central dice que para muchas distribuciones que no son normales, la distribución de muestreo para la media de la muestra estará cerca de una distribución normal cuando el tamaño de la muestra n sea grande. Para ilustrar esto, tome distribuciones como el uniforme (también sería bueno ver una distribución bimodal) y muestre cómo se ve la distribución de muestreo para la media para tamaños de muestra de 3, 4, 5, 10 y 100. El estudiante puede ver cómo la forma de la distribución cambia de algo que no parece normal en absoluto para n pequeña a algo que se parece mucho a una distribución normal para n grande.

Para convencer al estudiante de que estas distribuciones de muestreo realmente tienen estas formas, haga que los estudiantes realicen simulaciones generando muchas muestras de varios tamaños y calculen las medias de la muestra. Luego pídales que generen histogramas para estas estimaciones de la media. También sugeriría aplicar una demostración física que muestre cómo funciona esto usando una placa de quincunx. Mientras hace esto, señala cómo el dispositivo genera muestras de la suma de ensayos independientes de Bernoulli donde la probabilidad de ir a la izquierda o derecha en cada nivel es igual a 1/2. Las pilas resultantes en la parte inferior representan un histograma para esta distribución de muestreo (el binomio) y se puede ver que su forma se ve aproximadamente normal después de que una gran cantidad de bolas caen en la parte inferior del quincunx,

Michael R. Chernick
fuente
Gracias por las valiosas sugerencias. Realmente me gusta la idea de una demostración física real y definitivamente intentaré implementar algo como esto (suponiendo que pueda distraerlos de Facebook por el tiempo suficiente ...), aunque la conexión con la suma de los ensayos independientes de Bernoulli probablemente esté un poco por encima de sus posibilidades. cabezas! Gracias.
smillig
1
Pero ver la forma de distribución normal del experimento es realmente revelador. La primera vez que vi uno de estos se demostró en el Museo de Ciencias de Chicago cuando era un niño (unos 10 años). Entonces no sabía nada sobre estadísticas, pero nunca olvidé la curva.
Michael R. Chernick
1

Creo que sería bueno poner una 'población' de números en una bolsa (por ejemplo, del 1 al 10). Podrías hacer tus propias fichas, o usar monedas, naipes, etc.

Haga que los estudiantes se sienten en grupos (5 o más) y que cada uno elija un número de la bolsa. Luego, cada grupo calcula el valor medio para su grupo. Dígales que antes calculó la media de la población, grafíquela en un histograma y haga que un miembro de cada grupo venga y grafique su media de muestra en un historgrama en torno a esto. Haga que hagan este ejercicio varias veces para 'construir el histograma'.

Luego podrá mostrar gráficamente la variación en las medias de muestra alrededor de la media de la población. Calcule la variación en las medias muestrales en comparación con la media poblacional. Creo que los estudiantes recuerdan claramente que hicieron un ejercicio tan práctico y como resultado el concepto de variación de muestreo les será más fácil. Puede sonar un poco infantil, pero a los estudiantes a veces les gusta un cambio para hacer algo activo ... no hay muchas oportunidades para hacer esto en las estadísticas.

user41270
fuente