El estudio que estoy revisando informa que la altura media de 20 sujetos es de 1.70 metros con una desviación estándar de 0.0. ¿Significa esto que los 20 son exactamente 1.70 metros? ¿O es esto un error de informe?
fuente
El estudio que estoy revisando informa que la altura media de 20 sujetos es de 1.70 metros con una desviación estándar de 0.0. ¿Significa esto que los 20 son exactamente 1.70 metros? ¿O es esto un error de informe?
De acuerdo con este hilo SE de biología , la desviación estándar de la estatura del hombre adulto es aproximadamente metros, y de las hembras es de aproximadamente metros
Redondeando estos a un decimal, daría metros El hecho de que la desviación estándar se informa como metros indica una desviación estándar debajo metros ... pero una desviación estándar de, digamos, los metros seguirían siendo consistentes con la cifra informada, ya que se redondearía a , sin embargo, indicaría una variación en las alturas en la muestra solo ligeramente menor que la variabilidad que observamos todos los días en la población general.
¿Está bien informada la cifra? Bueno, sería mucho más útil si la desviación estándar se hubiera informado a dos decimales, como lo fue la media. También puede ser un simple error numérico o de redondeo; por ejemplopodría haber sido truncado aen lugar de redondeado . Pero, ¿podría ser posible que la figura se refiera al error estándar en su lugar? A menudo veo cifras escritas de una manera que hace ambiguo si se cita una desviación estándar o un error estándar, por ejemplo, "la media muestral es".
Cuán plausible es para la desviación estándar correcta redondear a a un decimal? El siguiente código R simula un millón de muestras de tamaño veinte tomadas de una población de desviación estándar (como se informó en otra parte para la altura femenina), encuentra la desviación estándar para cada muestra, traza un histograma de los resultados y calcula la proporción de muestras en las que la desviación estándar observada fue inferior :
set.seed(123) #so uses same random numbers each time code is run
x <- replicate(1e6, sd(rnorm(20, sd=0.06)))
hist(x)
sum(x < 0.05)/1e6
[1] 0.170691
De ahí una desviación estándar que se redondea a no es inverosímil, ocurre aproximadamente el diecisiete por ciento del tiempo si las alturas se distribuyen normalmente con una verdadera desviación estándar .
Sujeto a estos supuestos, también podemos calcular, en lugar de simular, esa probabilidad como aproximadamente diecisiete por ciento, de la siguiente manera:
donde hemos usado el hecho de que sigue la distribución chi-cuadrado con grados de libertad. Puedes calcular la probabilidad en R usando pchisq(q = 19*0.05^2/0.06^2, df = 19)
; si reemplazas por En línea con las cifras publicadas para las desviaciones estándar masculinas, la probabilidad se reduce a alrededor del cuatro por ciento. Como @whuber señala en los comentarios a continuación, es más probable que ocurra este tipo de SD "redondas a cero" pequeñas si el grupo de la muestra fue más homogéneo que la población general. Si la desviación estándar de la población es aproximadamente metros, entonces la probabilidad de obtener una desviación estándar de muestra tan pequeña también habría disminuido si el tamaño de la muestra hubiera sido mayor.
curve(pchisq(q = 19*0.05^2/x^2, df = 19), from=0.005, to=0.1,
xlab="Population SD", ylab="Probability sample SD < 0.05 if n = 20")
curve(pchisq(q = (x-1)*0.05^2/0.06^2, df = x-1), from=2, to=50, ylim=c(0,0.6),
xlab="Sample size", ylab="Probability sample SD < 0.05 if population SD = 0.06")
pchisq(q = 19*0.005^2/0.01^2, df = 19)
solo da un 0.04% de probabilidad de muestra SD <0.005. Incluso la población SD = 0.008 da una probabilidad de solo alrededor del 0.8%. Pero las DE de la población de 0.007, 0.006 y 0.005 dan probabilidades del 4%, 17% (¡no es coincidencia!) Y 54% respectivamenteEs casi seguro que es un error de informe, a menos que las personas hayan sido seleccionadas por su altura.
fuente