¿Por qué el error estándar de la intersección aumenta cuanto más

13

El error estándar de la expresión de intercepción ( β 0 ) en y = β 1 x + β 0 + ε está dada por S E ( β 0 ) 2 = σ 2 [ 1β^0y=β1x+β0+ε dondeˉxes la media de lasxi's.

SE(β^0)2=σ2[1n+x¯2i=1n(xix¯)2]
x¯xi

Por lo que entiendo, la SE cuantifica su incertidumbre- por ejemplo, en el 95% de las muestras, el intervalo contendrá el verdadero β 0 . No entiendo cómo el SE, una medida de incertidumbre, aumenta con ˉ x . Si simplemente cambio mis datos, de modo que ˉ x = 0 , mi incertidumbre disminuye. Eso parece irracional.[β^02SE,β^0+2SE]β0x¯x¯=0

Una interpretación análoga se - en la versión uncentered de mis corresponde a mi predicción en x = 0 , mientras que en los datos de centrado, ß 0 corresponde a mi predicción en x = ˉ x . Entonces, ¿significa esto que mi incertidumbre sobre mi predicción en x = 0 es mayor que mi incertidumbre sobre mi predicción en x = ˉ x ? Eso también parece irrazonable, el error ϵ tiene la misma varianza para todos los valores de xβ^0x=0β^0x=x¯x=0x=x¯ϵx, por lo que mi incertidumbre en mis valores predichos debería ser la misma para todas las .x

Hay lagunas en mi entendimiento, estoy seguro. ¿Podría alguien ayudarme a entender lo que está pasando?

elexhobby
fuente
3
¿Alguna vez has retrocedido algo en una cita? Muchos sistemas informáticos comienzan sus fechas en el pasado distante, a menudo hace más de 100 o más de 2000 años. La intersección estima el valor de sus datos extrapolados hacia atrás a esa hora de inicio. ¿Cuán seguro estaría, por ejemplo, del producto interno bruto de Irak en el año 0 CE basado en la regresión de una serie de datos del siglo XXI?
whuber
Estoy de acuerdo, tiene sentido si lo piensas de esta manera. Esto, y la respuesta de Gung, aclaran las cosas.
Elexhobby
2
Esta respuesta da una explicación intuitiva, con diagramas) de cómo surge, al proyectar la línea ajustada en términos de ajuste en la media (la línea ajustada pasa por ( ˉ x , ˉ y ) ) y muestra por qué la posición de donde la línea puede ir se extiende a medida que te alejas de ˉ x (que es causada por la incertidumbre en la pendiente). x¯(x¯,y¯)x¯
Glen_b -Reinstalar a Monica

Respuestas:

16

Debido a que la línea de regresión ajustada por mínimos cuadrados ordinarios necesariamente pasará por la media de sus datos (es decir, ), al menos mientras no suprima la intersección, incertidumbre sobre el valor verdadero de pendiente no tiene efecto en la posición vertical de la línea en la media de x (es decir, a y ˉ x ). Esto se traduce en menos incertidumbre vertical en ˉ x de lo que tiene más lejos de ˉ x que está. Si la intersección, donde x = 0 es ˉ x(x¯,y¯)xy^x¯x¯x¯x=0x¯, esto minimizará su incertidumbre sobre el verdadero valor de . En términos matemáticos, esto se traduce en el valor más pequeño posible del error estándar para β 0 . β0β^0

Aquí hay un ejemplo rápido en R:

set.seed(1)                           # this makes the example exactly reproducible
x0      = rnorm(20, mean=0, sd=1)     # the mean of x varies from 0 to 10
x5      = rnorm(20, mean=5, sd=1)
x10     = rnorm(20, mean=10, sd=1)
y0      = 5 + 1*x0  + rnorm(20)       # all data come from the same  
y5      = 5 + 1*x5  + rnorm(20)       #  data generating process
y10     = 5 + 1*x10 + rnorm(20)
model0  = lm(y0~x0)                   # all models are fit the same way
model5  = lm(y5~x5)
model10 = lm(y10~x10)

enter image description here

x0(x¯,y¯)y^x¯SE(β^0)x=10x=0


yxxnew

gung - Restablece a Monica
fuente
x=xxx¯=0x¯=x
(xx¯)2x¯2
@elexhobby, agregué información para responder a su comentario, es posible que también desee ver el material vinculado. Avísame si aún necesitas más.
gung - Restablece a Monica
SE(β^1)=σ2(xix¯)2xnewSE(β^1)(xnewx¯)2σ2n. Combine these together, and we get the uncertainty in the predicted value due to uncertainty in β^1 and β^0 is σ2n+σ2(xnewx¯)2(xix¯)2. Correct me if I'm wrong.
elexhobby
1
Furthermore, it is clear why the error in the vertical position is σ2n - we know that the line has to pass through y¯ at x=x¯. Now y¯ contains the average of n iid errors, and hence will have SE equal to σ2n. Wow! Thanks a lot for your diagram and clear explanation, I really appreciate.
elexhobby