Modelo de regresión lineal que mejor se adapta a datos con errores

9

Estoy buscando el algoritmo de regresión lineal que sea más adecuado para datos cuya variable independiente (x) tiene un error de medición constante y la variable dependiente (y) tiene un error dependiente de la señal.

ingrese la descripción de la imagen aquí

La imagen de arriba ilustra mi pregunta.

usuario46178
fuente
1
Si la variable constante x tiene un error de medición constante, y los errores se usan solo para ponderar las variables de forma relativa, ¿no es esta situación equivalente a no tener errores en x?
pedrofigueira
2
@pedro Ese no es el caso, porque los errores en no son meras ponderaciones en una fórmula. Con la regresión de errores en variables, los ajustes diferirán y las estimaciones de covarianza de los parámetros diferirán de la regresión ordinaria. x
whuber
1
Gracias por la aclaración. ¿Podría ampliar un poco sobre por qué ese es el caso?
pedrofigueira

Respuestas:

2

Error de medida en la variable dependiente

Dado un modelo lineal general con homosckedastic, no autocorrelacionado y no correlacionado con las variables independientes, deje que denote la variable "verdadera", y su medida observable El error de medición se define como su diferencia Por lo tanto, el modelo estimable es: Dado que son observado, podemos estimar el modelo por OLS. Si el error de medición en es estadísticamente independiente de cada variable explicativa, entonces εyye=y-y y = β 0 + β 1 x 1 + + β k x k + e + ε y,x1,...,xky(e+

(1)y=β0+β1x1++βkxk+ε
εyy
e=yy
(2)y=β0+β1x1++βkxk+e+ε
y,x1,,xkyε t e(e+ε)comparte las mismas propiedades que y los procedimientos de inferencia OLS habituales ( estadísticas, etc.) son válidos. Sin embargo, en su caso, esperaría una variación creciente de . Podrías usar:εte
  • un estimador ponderado de mínimos cuadrados (por ejemplo, Kutner et al. , §11.1; Verbeek , §4.3.1-3);

  • el estimador OLS, que aún es imparcial y consistente, y los errores estándar consistentes con la heterocedasticidad, o simplemente los errores estándar de Wite ( Verbeek , §4.3.4).

Error de medida en la variable independiente

Dado el mismo modelo lineal que el anterior, dejemos que denote el valor "verdadero" y su medida observable. El error de medición es ahora: Hay dos situaciones principales ( Wooldridge , §4.4.2). x k e kxkxk

ek=xkxk
  • x k x k = xCov(xk,ek)=0 : el error de medición no está correlacionado con la medida observada y, por lo tanto, debe correlacionarse con la variable no observada ; escribir y enchufar esto en (1): ya que y ambos no están correlacionados con cada , incluyendo , la medición solo aumenta la varianza del error y no viola ninguno de los supuestos de OLS;xkxk=xkek

    y=β0+β1x1++βkxk+(εβkek)
    εexjxk
  • x k y x 1 , , x kCov(xk,ηk)=0 : el error de medición no está correlacionado con la variable no observada y, por lo tanto, debe correlacionarse con la medida observada ; tal correlación causa problemas y la regresión de OLS de en generalmente da estimadores sesgados y sin consistencia.xkyx1,,xk

Hasta donde puedo adivinar mirando su gráfico (errores centrados en los valores "verdaderos" de la variable independiente), podría aplicarse el primer escenario.

Sergio
fuente