¿Por qué la desviación estándar muestral es un estimador sesgado de

57

Según el artículo de Wikipedia sobre la estimación imparcial de la desviación estándar, la muestra SD

s=1n1i=1n(xix¯)2

es un estimador sesgado de la DE de la población. Establece que .E(s2)E(s2)

NÓTESE BIEN. Las variables aleatorias son independientes y cada xiN(μ,σ2)

Mi pregunta es doble:

  • ¿Cuál es la prueba de la parcialidad?
  • ¿Cómo se calcula la expectativa de la desviación estándar de la muestra?

Mi conocimiento de matemáticas / estadísticas es solo intermedio.

Dav Weps
fuente
44
Encontrará que ambas preguntas se responden en el artículo de Wikipedia sobre la distribución de Chi .
whuber

Respuestas:

57

La respuesta de @ NRH a esta pregunta ofrece una prueba simple y agradable de la parcialidad de la desviación estándar de la muestra. Aquí calcularé explícitamente la expectativa de la desviación estándar de la muestra (la segunda pregunta del póster original) a partir de una muestra distribuida normalmente, en cuyo punto el sesgo es claro.

La varianza de la muestra no sesgada de un conjunto de puntos esx1,...,xn

s2=1n1i=1n(xix¯)2

Si las están distribuidas normalmente, es un hecho quexi

(n1)s2σ2χn12

donde es la verdadera varianza. La distribución χ 2 k tiene densidad de probabilidadσ2χk2

p(x)=(1/2)k/2Γ(k/2)xk/21ex/2

usando esto podemos derivar el valor esperado de ;s

E(s)=σ2n1E(s2(n1)σ2)=σ2n10x(1/2)(n1)/2Γ((n1)/2)x((n1)/2)1ex/2 dx

s2(n1)σ2χ2χ2

E(s)=σ2n10(1/2)(n1)/2Γ(n12)x(n/2)1ex/2 dx=σ2n1Γ(n/2)Γ(n12)0(1/2)(n1)/2Γ(n/2)x(n/2)1ex/2 dx=σ2n1Γ(n/2)Γ(n12)(1/2)(n1)/2(1/2)n/20(1/2)n/2Γ(n/2)x(n/2)1ex/2 dxχn2 density

χn2

E(s)=σ2n1Γ(n/2)Γ(n12)

s

σE(s)=σ(12n1Γ(n/2)Γ(n12))σ4n
n

nnσ=11/4n

ingrese la descripción de la imagen aquí

Macro
fuente
(4n)1
Realmente te esforzaste mucho para hacer esta Macro. Cuando vi la publicación por primera vez hace aproximadamente un minuto, estaba pensando en mostrar el sesgo utilizando la regla de Jensen, pero alguien ya lo hizo.
Michael Chernick
2
Por supuesto, esta es una forma redonda de mostrar que la desviación estándar está sesgada: respondía principalmente a la segunda pregunta del póster original: "¿Cómo se calcula la expectativa de la desviación estándar?".
Macro
2
sσk
2
skk
43

s2=1n1i=1n(xix¯)2
σ2
E(s2)<E(s2)=σ
s2σ2
NRH
fuente
19

Sn=i=1n(XiX¯n)2n1,
SnVar[Sn]0
0<Var[Sn]=E[Sn2]E2[Sn]E2[Sn]<E[Sn2]E[Sn]<E[Sn2]=σ.
zen
fuente