¿Qué es un estimador de la desviación estándar de la desviación estándar si se puede suponer la normalidad de los datos?
54
¿Qué es un estimador de la desviación estándar de la desviación estándar si se puede suponer la normalidad de los datos?
Respuestas:
Deje . Como se muestra en este hilo , la desviación estándar de la desviación estándar de la muestra,X1, . . . , Xnorte∼ N( μ , σ2)
es
donde es la función gamma , es el tamaño de la muestra y es la media de la muestra. Como es un estimador consistente de , esto sugiere reemplazar con en la ecuación anterior para obtener un estimador consistente de .n ¯ X = 1Γ ( ⋅ ) norte sσσsSD(s)X¯¯¯¯= 1norte∑nortei = 1Xyo s σ σ s SD(s)
Si busca un estimador imparcial, vemos en este hilo que , que, por linealidad de expectativa, sugiereE(s)=σ⋅2n−1−−−√⋅Γ(n/2)Γ(n−12)
como un estimador imparcial de . Todo esto junto con la linealidad de la expectativa proporciona un estimador imparcial de : S D ( s )σ SD(s)
fuente
Suponga que observa iid desde una normal con media cero y varianza . La desviación estándar (empírica) es la raíz cuadrada del estimador de (imparcial o no, esa no es la pregunta). Como estimador (obtenido con ), tiene una varianza que puede calcularse teóricamente. ¿Quizás lo que usted llama la desviación estándar de la desviación estándar es en realidad la raíz cuadrada de la varianza de la desviación estándar, es decir, ? No es un estimador, es una cantidad teórica (algo así comoσ 2 σ 2 σ 2 X 1 , ... , X n σ √X1,…,Xn σ2 σ^2 σ2 X1,…,Xn σ^ σ/ √E[(σ−σ^)2]−−−−−−−−−√ σ/n−−√ por confirmar) que se puede calcular explícitamente
fuente
@Macro proporcionó una gran explicación matemática con ecuaciones para calcular. Aquí hay una explicación más general para personas menos matemáticas.
Creo que la terminología "SD de SD" es confusa para muchos. Es más fácil pensar en el intervalo de confianza de una SD. ¿Qué tan precisa es la desviación estándar que calcula de una muestra? Por casualidad, es posible que haya obtenido datos estrechamente agrupados, lo que hace que la muestra SD sea mucho más baja que la población SD. O puede haber obtenido valores aleatorios que están mucho más dispersos que la población general, lo que hace que la muestra SD sea más alta que la población SD.
Interpretar el CI de la SD es sencillo. Comience con la suposición habitual de que sus datos se muestrearon de forma aleatoria e independiente de una distribución gaussiana. Ahora repita este muestreo muchas veces. Usted espera que el 95% de esos intervalos de confianza incluyan la SD real de la población.
¿Qué tan amplio es el intervalo de confianza del 95% de una SD? Depende del tamaño de la muestra (n), por supuesto.
n: IC 95% de DE
2: 0,45 * SD a 31,9 * SD
3: 0.52 * SD a 6.29 * SD
5: 0.60 * SD a 2.87 * SD
10: 0,69 * SD a 1,83 * SD
25: 0.78 * SD a 1.39 * SD
50: 0,84 * SD a 1,25 * SD
100: 0,88 * SD a 1,16 * SD
500: 0,94 * SD a 1,07 * SD
Calculadora web gratuita
fuente