Estoy buscando métodos que puedan usarse para estimar el modelo de error de medición "OLS".
x i = X i + e x , i Y i = α + β X i
Donde los errores son normales e independientes con variaciones desconocidas y . "OLS" estándar no funcionará en este caso. σ 2 x
Wikipedia tiene algunas soluciones poco atractivas: las dos te obligan a asumir que la "relación de varianza" o la " relación de fiabilidad " , donde es la varianza del verdadero regresor . No estoy satisfecho con esto, porque ¿cómo puede alguien que no conoce las variaciones conocer su relación? λ=σ 2 X σ 2 X Xi
De todos modos, ¿hay otras soluciones además de estas dos que no requieran que yo "sepa" nada sobre los parámetros?
Las soluciones solo para la intersección y la pendiente están bien.
fuente
Respuestas:
Hay una gama de posibilidades descritas por JW Gillard en Una descripción histórica de la regresión lineal con errores en ambas variables
Si no está interesado en los detalles o razones para la elección de un método sobre otro, sólo tiene que ir con el más simple, que consiste en trazar la línea a través del centro de gravedad con pendiente β = s y / s x , es decir, la razón de las desviaciones estándar observadas (haciendo que el signo de la pendiente sea el mismo que el signo de la covarianza de x e ); como probablemente pueda resolver, esto da una intersección en el eje de(x¯,y¯) β^=sy/sx x y y α^=y¯−β^x¯.
Los méritos de este enfoque particular son
La pendiente es la media geométrica de las pendientes de las dos pendientes de regresión lineal ordinarias. También es lo que obtendría si estandarizara las observaciones e y , dibujara una línea a 45 ° (o 135 ° si hay una correlación negativa) y luego desestandarice la línea. También podría verse como equivalente a hacer una suposición implícita de que las variaciones de los dos conjuntos de errores son proporcionales a las variaciones de los dos conjuntos de observaciones; Por lo que puedo decir, afirmas que no sabes de qué manera esto está mal.x y
Aquí hay un código R para ilustrar: la línea roja en el gráfico es la regresión OLS de en X , la línea azul es la regresión OLS de X en Y , y la línea verde es este método simple. Tenga en cuenta que la pendiente debe ser de aproximadamente 5.Y X X Y
fuente