En OLS, ¿es posible que el de una regresión en dos variables sea mayor que la suma de para dos regresiones en las variables individuales?
Editar: Ugh, esto es trivial; eso es lo que obtengo por tratar problemas que pensé mientras estaba en el gimnasio. Perdón por perder el tiempo otra vez. La respuesta es claramente sí.
, claramente. Pero debería ser 0 en el límite y debería ser 0.5 en el límite.
regression
least-squares
bsdfish
fuente
fuente
Respuestas:
Aquí hay un poco de R que establece una semilla aleatoria que dará como resultado un conjunto de datos que lo muestra en acción.
No solo es posible (como ya ha demostrado analíticamente) no es difícil de hacer. Dadas 3 variables normalmente distribuidas, parece suceder aproximadamente el 40% del tiempo.
fuente
No es posible Además, si A y B están correlacionados (si su r no es cero), el rsq de la regresión en ambos será menor que la suma de los rsq de sus regresiones individuales.
Tenga en cuenta que incluso si A y B no están completamente correlacionados, los rsq ajustados (que penalizan por una baja relación caso-predictor) pueden ser ligeramente diferentes entre las dos soluciones.
Tal vez le gustaría compartir más sobre la evidencia empírica que lo atrapó.
fuente