Rango posible de

10

Supongamos que hay tres series de tiempo, , eX1X2Y

Ejecución de regresión lineal ordinaria en ~ ( ), obtenemos . La regresión lineal ordinaria ~ llegar . Suponga queYX1Y=bX1+b0+ϵR2=UYX2R2=VU<V

¿Cuáles son los valores mínimos y máximos posibles de en la regresión ~ ( )?R2YX1+X2Y=b1X1+b2X2+b0+ϵ

Creo que el mínimo debería ser + un valor pequeño, ya que agregar nuevas variables siempre aumenta , pero no sé cómo cuantificar este pequeño valor, y no sé cómo obtener el rango máximo .R2VR2

Vendetta
fuente

Respuestas:

9

1) EDIT: comentario de Cardinal siguiente muestra que la respuesta correcta a la min pregunta es . Por lo tanto, estoy eliminando mi respuesta "interesante", pero en última instancia incorrecta, a esa parte de la publicación del OP. VR2V

2) El máximo es 1. Considere el siguiente ejemplo, que se ajusta a su caso.R2

x1 <- rnorm(100)
x2 <- rnorm(100)
y <- x1 + 2*x2

> summary(lm(y~x1))$r.squared
[1] 0.2378023                 # This is U
> summary(lm(y~x2))$r.squared
[1] 0.7917808                 # This is V; U < V
> summary(lm(y~x1+x2))$r.squared
[1] 1

Aquí estamos arreglando la varianza de en 0. Sin embargo, si desea , las cosas cambian un poco. Puede obtener el arbitrariamente cerca de 1 haciendo cada vez más pequeño, pero, como con el problema mínimo, no puede llegar allí, por lo que no hay un máximo. 1 se convierte en el supremum , ya que siempre es mayor que pero también es el límite como .σ 2 ϵ > 0 R 2 σ 2 ϵ R 2 σ 2 ϵ0ϵσϵ2>0R2σϵ2R2σϵ20

jbowman
fuente
2
(+1) Algunos comentarios: esta es una buena respuesta; es interesante que usted ha tomado un enfoque asintótica mientras que no está claro si el PO estaba interesado en eso o, posiblemente, un fijo uno (o ambos). Esta respuesta es un poco inconsistente con la restricción del OP de que , sin embargo, y si o para algunos , por ejemplo, entonces el mínimo para todos los tamaños de muestra fijos son exactamente . (Disculpe la patología de estos ejemplos). Además, OLS no es necesariamente consistente en ausencia de restricciones adicionales en los predictores. :)nU<VX1=0X1=a1aRR2V:=V(n)
cardenal
@cardinal: al releer, no puedo entender por qué tomé ese enfoque del problema mínimo, cuando ahora parece la respuesta obviamente correcta y, como has observado implícitamente, podría haber construido un ejemplo que lo logre la vena de la parte máxima ... oh bueno, tal vez mi café esta mañana se descafeinó accidentalmente. (¡Quizás debería revisar mis respuestas más a fondo antes de publicarlas también!)V
jbowman
¡No creo que debas eliminar lo que has escrito, lo cual encontré un enfoque interesante para responder la pregunta! Si bien las patologías que menciono ciertamente permiten un mínimo , uno podría preguntarse qué significa realmente . El otro ejemplo quizás no sea tan patológico ya que en una versión general de este problema, se extiende al caso en el que cualquier adicional está en el espacio de la columna de los otros predictores. :)R2X1=0Xi
cardenal
1
@ cardinal - gracias! Lo reconstruiré, tal vez un poco más formalmente, y lo pondré de nuevo en la parte inferior en un momento.
jbowman
5

Deje es igual a la correlación entre y , es igual a la correlación entre y , y la correlación entre y . Entonces para el modelo completo dividido por es igualr1,2X1X2r1,YX1Yr2,YX2YR2V

(1(1r1,22))(12r1,2r1,Yr2,Y+UV).

Entonces, para el modelo completo es igual a solo si y oR2Vr1,2=0r1,Y2=U=0

r1,22=2r1,2r1,Yr2,YUV.

Si , para el modelo completo es igual a .R 2 U + Vr1,2=0R2U+V

Margot
fuente
(+1) Lindo. Bienvenido al sitio. Considere registrar su cuenta para poder participar más plenamente. Tendré que ver esta expresión un poco más de cerca más adelante. :)
cardenal
4

Sin restricciones en y , entonces el mínimo es , y luego el máximo es el más pequeño . Esto se debe a dos variable podría ser perfectamente correlacionado (en cuyo caso la adición de la segunda variable no cambia el en absoluto) o que podría ser ortogonal en cuyo caso incluyendo tanto los resultados en . Se señaló correctamente en los comentarios que esto también requiere que cada uno sea ortogonal a , el vector de columna de 1s.UVVR 2 U + V 1min(V+U,1)R2U+V1

Agregó la restricción . Sin embargo, todavía es posible que . Es decir, , en cuyo caso, . Finalmente, es posible que por lo que el límite superior sigue siendo . U = 0 X 1Y min = max = V + 0 X 1X 2 min ( V + U , 1 )U<VX1X2U=0X1Ymin=max=V+0X1X2min(V+U,1)

Si supiera más sobre la relación entre y , creo que podría decir más. X 2X1X2

Joshua
fuente
1
(+1) Pero, tenga en cuenta que no es (del todo) cierto que si y son ortogonales, entonces sus valores individuales de se sumarán al incluir ambos en el modelo. Nosotros también necesitamos que sean ortogonales a los de todos unos vectores . Tenga en cuenta que puede usar en este sitio para marcar las matemáticas. :)X 2 R 2 1 LX1X2R21LATEX
cardenal
Eso es verdad. Muchas gracias por los comentarios y por señalar que se puede usar . Pensé que podría pero había intentado escapar de estilo matemático (y [en línea / ecuaciones. Escribir como lo haría en TeX funcionó de maravilla :)LATEX
Joshua