Perdóname si me he perdido algo bastante obvio.
Soy un físico con lo que es esencialmente una distribución (histograma) centrada en un valor medio que se aproxima a una distribución Normal. El valor importante para mí es la desviación estándar de esta variable aleatoria gaussiana. ¿Cómo trataría de encontrar el error en la desviación estándar de muestra? Tengo la sensación de que tiene algo que ver con el error en cada bin en el histograma original.
Respuestas:
Parece que está pidiendo un cálculo de la desviación estándar de la desviación estándar de la muestra. Es decir, está solicitando , dondeSD(s)=var(s)−−−−−√
¯ XX1,...,Xn∼N(μ,σ2) y es la media muestral.X¯¯¯¯
Primero, sabemos por las propiedades básicas de la varianza que
Como la varianza de la muestra es insesgada, sabemos que . En ¿ Por qué la desviación estándar muestral es un estimador sesgado de ? , se calcula, de lo que podemos inferirσ E ( s )E(s2)=σ2 σ E(s)
por lo tanto
fuente
La cantidad tiene una distribución chi-cuadrado con grados de libertad cuando las muestras son independientes y se distribuyen con la misma distribución normal. Esta cantidad se puede usar para obtener confianza intervalos para la varianza de lo normal y su desviación estándar. Si tiene los valores brutos y no solo el valor central de los contenedores, puede calcular .X=(n−1)s2/σ2 n−1 s2
Se sabe que si tiene una distribución de chi-cuadrado con grados de libertad, su varianza es . Sabiendo esto y el hecho de que obtenemos que tiene una varianza igual a Aunque es desconocido, puede aproximarlo por y tiene una idea aproximada de cuál es la varianza de .n - 1 2 ( n - 1 )X n−1 2(n−1) Var(cX)=c2Var(X) s2
fuente
Hay varias formas de cuantificar el error de la desviación estándar en el caso normal. Voy a presentar la probabilidad de perfil de que se puede usar para aproximar los intervalos de confianza.σ
Sea una muestra de un Normal . La función de probabilidad correspondiente está dada porx=(x1,...,xn) (μ,σ)
Luego, los estimadores de máxima verosimilitud están dados por , donde . Dado que está interesado en cuantificar el error en , puede calcular la probabilidad de perfil normalizado de este parámetro de la siguiente manera.(μ^,σ^)=(x¯,s) σs=1n∑nj=1(xj−x¯)2−−−−−−−−−−−−−−√ σ
Tenga en cuenta que . Un intervalo de nivel tiene una confianza aproximada de . A continuación, adjunto un código que puede usarse para calcular estos intervalos. Puede modificarlo en consecuencia en su contexto (o si publica los datos, puedo incluir estos cambios).0.147 0.95 RRp:R+→(0,1] 0.147 0.95 R
Una ventaja de este tipo de intervalos es que son invariables bajo transformaciones. En este caso, si calcula un intervalo para , , entonces el intervalo correspondiente para es simplemente .I = ( L , U ) σ 2 I ′ = ( L 2 , U 2 )σ I=(L,U) σ2 I′=(L2,U2)
fuente