He estado investigando el funcionamiento interno del error estándar recientemente, y me encontré incapaz de entender cómo funciona. Entiendo que el error estándar es que es la desviación estándar de la distribución de medias muestrales. Mis preguntas son:
• ¿Cómo sabemos que el error estándar es la desviación estándar de las medias de la muestra cuando generalmente tomamos una sola muestra?
• ¿Por qué la ecuación para calcular el error estándar no refleja la ecuación de desviación estándar para una sola muestra?
standard-error
luciano
fuente
fuente
Respuestas:
Sí, el error estándar de la media (SEM) es la desviación estándar (SD) de las medias. (El error estándar es otra forma de decir SD de una distribución de muestreo. En este caso, la distribución de muestreo es la media para muestras de un tamaño fijo, digamos N.) Existe una relación matemática entre el SEM y la población SD: SEM = población SD / la raíz cuadrada de N. Esta relación matemática es muy útil, ya que casi nunca tenemos una estimación directa de la SEM pero sí tenemos una estimación de la SD de la población (es decir, la SD de nuestra muestra). En cuanto a su segunda pregunta, si tuviera que recolectar múltiples muestras de tamaño N y calcular la media para cada muestra, podría estimar el SEM simplemente calculando la DE de las medias. Entonces, la fórmula para SEM sí refleja la fórmula para el SD de una sola muestra.
fuente
Supongamos que son independientes e idénticamente distribuidos. Esta es la situación a la que estoy bastante seguro de que te refieres. Deje que su media común sea μ y su varianza común sea σ 2 .X1,X2,…,Xn μ σ2
Ahora la media muestral es . La linealidad de la expectativa muestra que la media de X b también es μ . El supuesto de independencia implica que la varianza de X b es la suma de las varianzas de sus términos. Cada uno de estos términos X i / n tiene una varianza σ 2 / n 2 (porque la varianza de una constante por una variable aleatoria es la constante al cuadrado por la varianza de la variable aleatoria). Tenemos nXb=∑iXi/n Xb μ Xb Xi/n σ2/n2 n distribuyó idénticamente tales variables para sumar, por lo que cada término tiene esa misma varianza. Como resultado, obtenemos para la varianza de la media muestral.nσ2/n2=σ2/n
Por lo general, no conocemos por lo que debemos estimarlo a partir de los datos. Dependiendo de la configuración, hay varias formas de hacerlo. Las dos estimaciones de uso general más comunes de σ 2 son la varianza muestral s 2 = 1σ2 σ2 y un pequeño múltiplo,s 2 u =ns2=1n∑i(Xi−Xb)2 (que es un estimador imparcial deσ2). El uso de cualquiera de estos en lugar deσ2en el párrafo anterior y tomar la raíz cuadrada da el error estándar en forma des/√s2u=nn−1s2 σ2 σ2 osu/ √s/n−−√ .su/n−−√
fuente
In that we typically believe the null hypothesis is not true, @JoelW.'s point is right, but I work through this point, because I think the clarity it affords is helpful for understanding these issues.
fuente