¿Qué calcula realmente la fórmula y ~ x + 0 en R?

Respuestas:

18

Agregar +0(o -1) a una fórmula modelo (por ejemplo, in lm()) en R suprime la intersección. Esto generalmente se considera algo malo; ver:

La pendiente estimada se calcula de manera diferente dependiendo de si también se estima la intersección, a saber:

(with intercept)β^1=xiyi(xi)(yi)Nxi2(xi)2N(without intercept)β^1=xiyixi2

0

R2

Aquí están las fórmulas subyacentes:

(with intercept)R2=1(yiy^i)2(yiy¯)2(without intercept)R2=1(yiy^i)2yi2
gung - Restablece a Monica
fuente
Gracias Gung! Si suprimo la Intercepción, mi R cuadrado múltiple mejora, de repente. ¿Puede ayudarme aquí?
JimBoy
66
No existe una forma acordada para calcular r al cuadrado sin una intercepción. La r al cuadrado no tiene su interpretación habitual. Haciendo de regresión sin una intercepción es casi siempre una mala idea
Repmat
5

Depende del contexto (por supuesto), en el lm(...)comando en R suprimirá la intercepción. Es decir, haces una regresión a través del origen.

Tenga en cuenta que la mayoría de los libros de texto sobre el tema de la regresión le dirán que forzar la intercepción (a cualquier valor) es una mala idea.

La interpretación de x no cambia, pero el valor (en comparación con y sin una intercepción) cambiará, a veces de manera muy significativa.

Repmat
fuente
Gracias Repmat! Obtengo estimaciones muy diferentes si suprimo la intercepción en comparación con cuando no lo hago. Además, todas las pruebas t se vuelven altamente significativas. ¿Sabes por qué es esto?
JimBoy
2
La intersección absorberá cualquier variable que no sea 0 no contenida en el modelo. Con la intercepción desaparecida, la variación tiene que ir a algún lado. Es por eso que la mayoría de los libros, como regla general, establece que la regresión sin una intersección siempre es incorrecta. Es decir, OLS siempre está sesgado y es consistente en este caso (con algunas excepciones).
Repmat