¿Qué referencias deberían citarse para apoyar el uso de 30 como un tamaño de muestra suficientemente grande?

41

He leído / escuchado muchas veces que el tamaño de la muestra de al menos 30 unidades se considera como "muestra grande" (los supuestos de normalidad de los medios generalmente se mantienen aproximadamente debido al CLT, ...). Por lo tanto, en mis experimentos, generalmente genero muestras de 30 unidades. ¿Puede darme alguna referencia que debería citarse cuando se usa el tamaño de muestra 30?

Lan
fuente
2
Sin referencia al número de parámetros que intenta estimar, o de manera equivalente al tipo de modelo con el que está trabajando, parece bastante difícil darle una respuesta clara.
chl
2
La aceptación de n = 30 como límite de muestras pequeñas y grandes no está bien respaldada por ninguna técnica estadística.
Jibol

Respuestas:

37

La elección de n = 30 para un límite entre muestras pequeñas y grandes es solo una regla general. Hay una gran cantidad de libros que citan (alrededor) de este valor, por ejemplo, la Probabilidad e Inferencia estadística de Hogg y Tanis (7e) dice "mayor que 25 o 30".

Dicho esto, la historia que me contaron fue que la única razón por la que 30 se consideraba un buen límite era porque hacía que las bonitas tablas t de Student en la parte posterior de los libros de texto encajaran bien en una página. Eso, y los valores críticos (entre la t de Student y la Normal) solo están desactivados en aproximadamente hasta 0.25, de todos modos, desde df = 30 a df = infinito. Para el cálculo manual, la diferencia realmente no importaba.

Hoy en día es fácil calcular valores críticos para todo tipo de cosas con 15 decimales. Además de eso, tenemos métodos de remuestreo y permutación para los cuales ni siquiera estamos restringidos a distribuciones de población paramétricas.

En la práctica, nunca confío en n = 30. Trace los datos. Superponga una distribución normal, si lo desea. Evalúe visualmente si una aproximación normal es apropiada (y pregunte si realmente es necesaria una aproximación). Si la generación de muestras para investigación y una aproximación es obligatoria, genere un tamaño de muestra suficiente para que la aproximación sea lo más cercana posible (o lo más cerca posible computacionalmente).


fuente
13
Aquí hay una página sobre qué tan buena es la aproximación normal de la distribución t para n = 30. johndcook.com/normal_approx_to_t.html
John D. Cook
41

En realidad, el "número mágico" 30 es una falacia. Ver el encantador artículo de Jacob Cohen, Cosas que he aprendido (hasta ahora) (Am. Psych. Diciembre 1990 45 # 12, pp 1304-1312) . Este mito es su primer ejemplo de cómo "algunas cosas que aprendes no son así".

[Uno] de mis colegas candidatos a doctorado realizó una disertación [con] una muestra de solo 20 casos por grupo. ... [Más tarde descubrí ... que para una comparación de la media de dos grupos independientes con por grupo en el nivel de dos colas santificado , la probabilidad de que un efecto de tamaño mediano sea etiquetado como por un alto grado ... un t prueba fue sólo . Por lo tanto, fue aproximadamente un lanzamiento de moneda si uno obtendría un resultado significativo, aunque, en realidad, el tamaño del efecto fue significativo. ... [Mi amigo] terminó con resultados no significativos, con los cuales procedió a demoler una rama importante de la teoría psicoanalítica.n=30.05.47.47

Carlos Accioly
fuente
2
Hermosa referencia - y puntual en relevante. Gracias.
whuber
1
@whuber ¿Recuerdas qué papel era? El enlace está roto por ahora. ¿Quizás este psych.colorado.edu/~willcutt/pdfs/Cohen_1990.pdf , "Cosas que he aprendido (hasta ahora)"? El año coincide con el de la URL del enlace roto.
ameba dice Reinstate Monica
1
@Amoeba Guardé este documento cuando lo leí, así puedo confirmar que lo que encontraste es el deseado. He actualizado esta respuesta para incluir una cita junto con su enlace.
whuber
@Carlos Accioly Lo actualicé con el nuevo enlace ya que el anterior estaba roto.
Akshay Bansal
9

En mi opinión, todo depende de para qué quieres usar tu muestra. Dos ejemplos "tontos" para ilustrar lo que quiero decir: si necesita estimar una media, 30 observaciones es más que suficiente. Si necesita estimar una regresión lineal con 100 predictores, 30 observaciones no serán lo suficientemente cercanas.

bhm
fuente
9

μ¯(n)

En términos más generales, el CLT necesita esencialmente dos pilares para sostener:

  1. Que las variables aleatorias son independientes: que puede reordenar sus observaciones sin perder ninguna información *.
  2. Que el rv proviene de una distribución con segundos momentos finitos: lo que significa que los estimadores clásicos de media y sd tienden a converger a medida que aumenta el tamaño de la muestra.

(Ambas condiciones pueden estar algo debilitadas, pero las diferencias son en gran medida de naturaleza teórica)

usuario603
fuente
66
Su ejemplo ilustra el valor de las estadísticas robustas. La mediana de la muestra estima el parámetro de ubicación de un pozo de distribución de Cauchy. Se podría argumentar que el eslabón más débil en el uso de una prueba t con 30 muestras es la prueba t, no las 30 muestras.
John D. Cook, el
1
John:> "Se podría argumentar que el eslabón más débil al usar una prueba t con 30 muestras es la prueba t, no las 30 muestras". Muy cierto, y también la suposición de que los datos son iid . Además, la mediana es MLE para variables aleatorias distribuidas de Cauchy (y, por lo tanto, eficientes), pero en general podría necesitar más de 30 observaciones.
usuario603
1
No todas las versiones del CLT se basan en una distribución idéntica, ni siquiera en la independencia. Los básicos enseñados a estudiantes de pregrado a menudo lo hacen, pero hay versiones que no hacen ambas suposiciones, por ejemplo, el CLT de Lyapunov asume independencia pero no distribuciones idénticas, y la condición de independencia también se puede relajar, por ejemplo, vea aquí . Esa cosa de "reordenamiento" tampoco es lo mismo que independencia. Algunas formas de dependencia no dependen del orden.
Glen_b
2
Un tamaño de muestra de 50,000 es insuficiente para que el CLT funcione lo suficientemente bien como para calcular un intervalo de confianza para la media de una distribución logarítmica normal.
Frank Harrell