Determinación de la media verdadera a partir de observaciones ruidosas

13

Tengo un gran conjunto de puntos de datos de la forma (media, stdev). Deseo reducir esto a una sola (mejor) media y una (con suerte) menor desviación estándar.

Claramente podría simplemente calcular datameanN , sin embargo, esto no tiene en cuenta el hecho de que algunos de los puntos de datos son significativamente más precisos que otros.

En pocas palabras, deseo preformar un promedio ponderado de estos puntos de datos, pero no sé cuál debería ser la función de ponderación en términos de la desviación estándar.

Miguel
fuente

Respuestas:

24

Busca un estimador lineal para la media μ de la forma

μ^=i=1nαixi

donde el αi son los pesos y son las observaciones. El objetivo es encontrar valores apropiados para los pesos. Deja que σ i ser la verdadera desviación estándar de x i , que puede o no coincidir con el estimado de la desviación estándar es probable que tenga. Suponga que las observaciones son imparciales; es decir, todas sus expectativas son iguales a la media μ . En estos términos podemos calcular que la expectativa de μ esxiσixiμμ^

E[μ^]=i=1nαiE[xi]=μi=1nαi

y (siempre que los no están correlacionados) la varianza de este estimador esxi

Var[μ^]=i=1nαi2σi2.

En este punto, muchas personas requieren que el estimador sea imparcial; es decir, queremos que su expectativa sea igual a la media real. Esto implica que los pesos deben sumarse a la unidad. Sujeto a esta restricción, la precisión del estimador (medida con un error cuadrático medio) se optimiza minimizando la varianza. La solución única (obtenida fácilmente con un multiplicador de Lagrange o reinterpretando la situación geométricamente como un problema de minimización de distancia) es que los pesos deben ser proporcionales a 1 / σ 2 i . αi1/σi2 La restricción de la suma a la unidad fija sus valores, produciendo

μ^=i=1nxi/σi2i=1n1/σi2

y

Var[μ^]=1i=1n1/σi2=1n(1ni=1n1σi2)1.

En palabras,

1/n

σi

whuber
fuente
1
y relacionado con esta respuesta, también de whuber: stats.stackexchange.com/questions/9071/…
Henry
¿Qué pasaría si no "asumimos que las observaciones son imparciales"? Con esa afirmación está diciendo que si se agregan infinitas mediciones individuales al azar a la observaciónxi