¿Cómo funciona el error estándar?

17

He estado investigando el funcionamiento interno del error estándar recientemente, y me encontré incapaz de entender cómo funciona. Entiendo que el error estándar es que es la desviación estándar de la distribución de medias muestrales. Mis preguntas son:

• ¿Cómo sabemos que el error estándar es la desviación estándar de las medias de la muestra cuando generalmente tomamos una sola muestra?

• ¿Por qué la ecuación para calcular el error estándar no refleja la ecuación de desviación estándar para una sola muestra?

luciano
fuente
Cuando dice "muestra única", ¿se refiere a un conjunto de muestras o realmente a un tamaño de muestra de 1?
Erik
1
Estos se explican por un problema simple pero interesante (una respuesta ternaria) en lenguaje simple y no estadístico en stats.stackexchange.com/a/18609 .
whuber

Respuestas:

13

Sí, el error estándar de la media (SEM) es la desviación estándar (SD) de las medias. (El error estándar es otra forma de decir SD de una distribución de muestreo. En este caso, la distribución de muestreo es la media para muestras de un tamaño fijo, digamos N.) Existe una relación matemática entre el SEM y la población SD: SEM = población SD / la raíz cuadrada de N. Esta relación matemática es muy útil, ya que casi nunca tenemos una estimación directa de la SEM pero sí tenemos una estimación de la SD de la población (es decir, la SD de nuestra muestra). En cuanto a su segunda pregunta, si tuviera que recolectar múltiples muestras de tamaño N y calcular la media para cada muestra, podría estimar el SEM simplemente calculando la DE de las medias. Entonces, la fórmula para SEM sí refleja la fórmula para el SD de una sola muestra.

Joel W.
fuente
13

Supongamos que son independientes e idénticamente distribuidos. Esta es la situación a la que estoy bastante seguro de que te refieres. Deje que su media común sea μ y su varianza común sea σ 2 .X1,X2,,Xnμσ2

Ahora la media muestral es . La linealidad de la expectativa muestra que la media de X b también es μ . El supuesto de independencia implica que la varianza de X b es la suma de las varianzas de sus términos. Cada uno de estos términos X i / n tiene una varianza σ 2 / n 2 (porque la varianza de una constante por una variable aleatoria es la constante al cuadrado por la varianza de la variable aleatoria). Tenemos nXb=iXi/nXbμXbXi/nσ2/n2ndistribuyó idénticamente tales variables para sumar, por lo que cada término tiene esa misma varianza. Como resultado, obtenemos para la varianza de la media muestral.nσ2/n2=σ2/n

Por lo general, no conocemos por lo que debemos estimarlo a partir de los datos. Dependiendo de la configuración, hay varias formas de hacerlo. Las dos estimaciones de uso general más comunes de σ 2 son la varianza muestral s 2 = 1σ2σ2 y un pequeño múltiplo,s 2 u =ns2=1ni(XiXb)2(que es un estimador imparcial deσ2). El uso de cualquiera de estos en lugar deσ2en el párrafo anterior y tomar la raíz cuadrada da el error estándar en forma des/su2=nn1s2σ2σ2 osu/s/n .su/n

Michael R. Chernick
fuente
1
Esto es muy bueno. ¿Tiene sugerencias para libros o lecturas para desarrollar una línea similar de habilidades de pensamiento? Gracias.
q126y
Elegante respuesta!
Jinhua Wang
7

σx¯2=σpop2nj,
σpop2njF
F=nj×sx¯2spooled within group2
In this case, we really would be using the standard formula (only applied over the group means), that is:
sx¯2=j=1nj(x¯jx¯.)2nj1,
with x. being the mean of the group means.

In that we typically believe the null hypothesis is not true, @JoelW.'s point is right, but I work through this point, because I think the clarity it affords is helpful for understanding these issues.

gung - Reinstate Monica
fuente
2
I think your comment is basically the same as this one, which was written with less mathematical notation: stats.stackexchange.com/questions/32206/…
Joel W.