Regresión lineal con ruido de disparo.

8

Estoy buscando la terminología estadística correcta para describir el siguiente problema.

Quiero caracterizar un dispositivo electrónico que tenga una respuesta lineal

Y=β0+β1X+ϵ

dónde ϵN(0,σro2)es un término debido al ruido de lectura del dispositivo. Para determinarβ0,β1,σro2 Mediría una serie de respuestas {Xi,Yi}y aplique la caja de herramientas de regresión lineal estándar. Pero no sé qué demoniosXison exactamente, porque uso una fuente que se ve afectada por el ruido de disparo. Es decir, sé que si configuro el dial en la fuente a un cierto valorJi entonces XiN(μ,μ) (un gaussiano con promedio μ y varianza μ)

Esto parece un modelo de regresión lineal de errores en variables ( http://en.wikipedia.org/wiki/Errors-in-variables_models ), donde no por el hecho de que para caracterizar mi dispositivo en todo su rango de entrada , durante las mediciones tengo que cambiar el valor deJi, y ahora la varianza de la Xi no es fijo, pero depende de Xi (a través de J_i), aunque debido al ruido de disparo si Xi=Xj Esto no significa que la varianza de Xi es lo mismo que la varianza de Xj.

¿Cómo se llama este modelo? ¿Hay artículos en los que pueda descubrir que se aborda este problema? ¿O estoy formulando de manera incorrecta?

GVstats
fuente
Var (Xi) = μ = E (Xi)> 0. Si esto se solucionara, esto sería un error en el modelo de variables con relación de varianza2 ro/ μ. No es porque μ cambie con el Xi. He visto modelos con varianza no constante en Y y modelos con errores en variables pero no este tipo de modelo que tiene errores en variables con varianza no constante. Cuando la varianza en Y no es constante, a veces es posible modelar la varianza en función del valor de la covariable x. Tal vez se podría hacer algo así por el error en X.
Michael R. Chernick

Respuestas:

3

El modelo de probabilidad para tal ruido de disparo es

XPoisson(μ),Y|XNormal(β0+β1X,σ2).

Una buena estimación de μ es la media de X y una buena estimación de (β0,β1) se proporciona por mínimos cuadrados ordinarios, porque los valores de Y se supone independiente, idénticamente distribuido y normal.

La estimación de σ2 dado por OLS es inapropiado aquí, sin embargo, debido a la aleatoriedad de X. La estimación de máxima verosimilitud es

s2=Sxy22SxSySxy+Sxx(Sy2Syy)+Sx2SyySx2Sxx.

En esta notación, Sx es la media X valor, Sxy es la media de los productos de la X y Y valores, etc.

Podemos esperar que los errores estándar de estimación en los dos enfoques (OLS, que no es del todo correcto, y MLE como se describe aquí) difieran . Hay varias formas de obtener errores estándar de ML: consulte una referencia. Porque la probabilidad de registro es relativamente simple (especialmente cuando el Poisson(μ) la distribución es aproximada por una Normal(μ,μ) distribución para grandes μ), estos errores estándar se pueden calcular en forma cerrada si se desea.


Como ejemplo trabajado, generé12 X valores de un Poisson(100) distribución:

94,99,106,87,91,101,90,102,93,110,97,123

Luego, estableciendo β0=3, β1=1/2y σ=1Genere 12 correspondiente Y valores:

47.4662,53.5622,54.6656,45.3592,49.0347,53.8803,48.3437,54.2255,48.4506,58.6761,50.7423,63.9922

El significado X valor es igual 99.4167, la estimación de μ. Los resultados de OLS (que son idénticos al MLE de los coeficientes) estimanβ0 como 1.24 y β1 como 0.514271. No es de extrañar la estimación de la intercepción,β0, parte de su verdadero valor de 3porque estos Xlos valores permanecen lejos del origen. La estimación de la pendiente,β1, está cerca del verdadero valor de 0.5.

La estimación de MCO de σ2, sin embargo, es 0.715, menor que el verdadero valor de 1. El MLE deσ2 funciona para 0.999351. (Es un accidente que ambas estimaciones sean bajas y que el MLE sea mayor que la estimación OLS).

Figura

La línea es tanto el ajuste de MCO como la estimación de máxima verosimilitud para el modelo de probabilidad conjunta de Poisson-Normal.

whuber
fuente