El error estándar de la expresión de intercepción ( β 0 ) en y = β 1 x + β 0 + ε está dada por S E ( β 0 ) 2 = σ 2 [ 1 dondeˉxes la media de lasxi's.
Por lo que entiendo, la SE cuantifica su incertidumbre- por ejemplo, en el 95% de las muestras, el intervalo contendrá el verdadero β 0 . No entiendo cómo el SE, una medida de incertidumbre, aumenta con ˉ x . Si simplemente cambio mis datos, de modo que ˉ x = 0 , mi incertidumbre disminuye. Eso parece irracional.
Una interpretación análoga se - en la versión uncentered de mis corresponde a mi predicción en x = 0 , mientras que en los datos de centrado, ß 0 corresponde a mi predicción en x = ˉ x . Entonces, ¿significa esto que mi incertidumbre sobre mi predicción en x = 0 es mayor que mi incertidumbre sobre mi predicción en x = ˉ x ? Eso también parece irrazonable, el error ϵ tiene la misma varianza para todos los valores de x, por lo que mi incertidumbre en mis valores predichos debería ser la misma para todas las .
Hay lagunas en mi entendimiento, estoy seguro. ¿Podría alguien ayudarme a entender lo que está pasando?
fuente
Respuestas:
Debido a que la línea de regresión ajustada por mínimos cuadrados ordinarios necesariamente pasará por la media de sus datos (es decir, ), al menos mientras no suprima la intersección, incertidumbre sobre el valor verdadero de pendiente no tiene efecto en la posición vertical de la línea en la media de x (es decir, a y ˉ x ). Esto se traduce en menos incertidumbre vertical en ˉ x de lo que tiene más lejos de ˉ x que está. Si la intersección, donde x = 0 es ˉ x(x¯,y¯) x y^x¯ x¯ x¯ x=0 x¯ , esto minimizará su incertidumbre sobre el verdadero valor de . En términos matemáticos, esto se traduce en el valor más pequeño posible del error estándar para β 0 . β0 β^0
Aquí hay un ejemplo rápido en
R
:fuente