Estoy buscando el algoritmo de regresión lineal que sea más adecuado para datos cuya variable independiente (x) tiene un error de medición constante y la variable dependiente (y) tiene un error dependiente de la señal.
La imagen de arriba ilustra mi pregunta.
regression
linear-model
measurement-error
measurement
usuario46178
fuente
fuente
Respuestas:
Error de medida en la variable dependiente
Dado un modelo lineal general con homosckedastic, no autocorrelacionado y no correlacionado con las variables independientes, deje que denote la variable "verdadera", y su medida observable El error de medición se define como su diferencia Por lo tanto, el modelo estimable es: Dado que son observado, podemos estimar el modelo por OLS. Si el error de medición en es estadísticamente independiente de cada variable explicativa, entonces εy∗ye=y-y∗ y = β 0 + β 1 x 1 + ⋯ + β k x k + e + ε y,x1,...,xky(e+
un estimador ponderado de mínimos cuadrados (por ejemplo, Kutner et al. , §11.1; Verbeek , §4.3.1-3);
el estimador OLS, que aún es imparcial y consistente, y los errores estándar consistentes con la heterocedasticidad, o simplemente los errores estándar de Wite ( Verbeek , §4.3.4).
Error de medida en la variable independiente
Dado el mismo modelo lineal que el anterior, dejemos que denote el valor "verdadero" y su medida observable. El error de medición es ahora: Hay dos situaciones principales ( Wooldridge , §4.4.2). x k e kx∗k xk
x ∗ k x ∗ k = xCov(xk,ek)=0 : el error de medición no está correlacionado con la medida observada y, por lo tanto, debe correlacionarse con la variable no observada ; escribir y enchufar esto en (1):
ya que y ambos no están correlacionados con cada , incluyendo , la medición solo aumenta la varianza del error y no viola ninguno de los supuestos de OLS;x∗k x∗k=xk−ek
x k y x 1 , … , x kCov(x∗k,ηk)=0 : el error de medición no está correlacionado con la variable no observada y, por lo tanto, debe correlacionarse con la medida observada ; tal correlación causa problemas y la regresión de OLS de en generalmente da estimadores sesgados y sin consistencia.xk y x1,…,xk
Hasta donde puedo adivinar mirando su gráfico (errores centrados en los valores "verdaderos" de la variable independiente), podría aplicarse el primer escenario.
fuente