Supongamos que tengo un N -vector Y de variables dependientes, y un N -vector X de variable independiente. Cuando Y se traza contra 1X , veo que hay una relación lineal (tendencia al alza) entre los dos. Ahora, esto también significa que hay una tendencia a la baja lineal entreYyX.
Ahora, si funciono la regresión:
y obtener el valor ajustado Y = β XY= β∗ X+ ϵY^= β^X
Luego ejecuto la regresión: y obtengo el valor ajustado ~ Y = α 1Y= α ∗ 1X+ ϵY~= α^1X
¿Serán los dos valores predichos, y aproximadamente iguales?~ YY^Y~
Cuando Y se traza contra , veo que hay una relación lineal (tendencia al alza) entre los dos. Ahora, esto también significa que hay una tendencia lineal descendente entre Y y X1X
La última oración es incorrecta: hay una tendencia a la baja, pero de ninguna manera es lineal:
Usé una como función además de un poco de ruido enY. Como puede ver, mientras trazaYcontra1F( x ) = 1XYY produce un comportamiento lineal,YcontraX1XYX está lejos de ser lineal.
(@whuber señala que la contra 1Y trama X no parece homoscedastic. Creo que parece tener una mayor varianza paraYbajoporque la densidad de mayúsculas mucho más alta conduce a un rango mayor, que es esencialmente lo que percibimos. En realidad, los datos son homoscedastic: solíagenerar los datos, por lo que no depende del tamaño deX).1XYY = 1 / X + rnorm (length (X), sd = 0.1)X
Entonces, en general, la relación es muy no lineal. Es decir, a menos que su rango de sea tan estrecho que pueda aproximarse a d 1XAquí hay un ejemplo:re1XreX= - 1X2≈ c o n s t .
Línea de fondo:
En general, es muy difícil aproximar un Función de tipo X por una función lineal o polinómica. Y sin un término compensado, nunca obtendrá una aproximación razonable.1X
Si el intervalo es lo suficientemente estrecho como para permitir una aproximación lineal, de todos modos no podrá ver los datos para adivinar que la relación debería ser 1X y no lineal (X).1XX
Comienza con una suposición inválida: el OP nunca afirmó que y X están linealmente relacionados. La única afirmación fue que Y y 1 / X parecen estar linealmente relacionados (con una pendiente negativa). Eso, por supuesto, indica que Y y X están relacionados no linealmente . Creo que esta es una desviación tan severa de lo que plantea la pregunta que el resto de su publicación solo podría confundir aún más a los lectores. YXY1 / XYX
whuber
2
@whuber: Lo siento mucho, pero parece ser bastante denso en este momento. La pregunta dice: "Cuando Y se traza contra 1 / X, veo que hay una relación lineal (tendencia al alza)". Eso es lo que traté de representar en la primera y tercera imagen: Y sobre 1 / X aumentando linealmente. Luego tracé la Y correspondiente sobre X (no lineal, decreciente). ¿Dónde entiendo mal el OP?
Cbeleites descontento con SX
1
No se arrepienta, ¡simplemente leí mal su publicación (al transponer las etiquetas de los ejes X en la primera imagen)! La culpa es toda mía. Por lo tanto, estoy votando su respuesta, que es correcta e informativa. Sin embargo, si tiene la oportunidad, es posible que desee comentar sobre el efecto de esta transformación en la homocedasticidad (o falta de ella) de los residuos (que se pueden detectar en su gráfico vs 1 / X ). Y1 / X
whuber
Gracias por las observaciones sobre la homocedasticidad. Al transformar la variable independiente , no cambia la homocedasticidad de la respuesta, pero su apariencia ciertamente puede cambiar, como usted señala, lo que es útil saber. (Hemos visto este fenómeno en varios otros puestos, en los que la gente mal atributo heterocedasticidad a meras diferencias en las poblaciones de grupo, por ejemplo.)
whuber
Muy minuciosa respuesta y comentarios! ¡Gracias @cbeleites y @whuber!
Mayou
2
No veo ninguna razón para que sean "aproximadamente iguales" en general, pero ¿qué quiere decir exactamente con aproximadamente igual?
Aquí hay un ejemplo de juguete:
library(ggplot2)
n <- 10^3
df <- data.frame(x=runif(n, min=1, max=2))
df$y <- 5 / df$x + rnorm(n)
p <- (ggplot(df, aes(x=x, y=y)) +
geom_point() +
geom_smooth(method="lm", formula=y ~ 0 + x) + # Blue, OP's y hat
geom_smooth(method="lm", formula=y ~ 0 + I(x^-1), color="red")) # Red, OP's y tilde
p
La imagen:
El modelo "azul" sería mucho mejor si se le permitiera tener un término de intercepción (es decir, constante) ...
Es difícil saber qué estás haciendo con el modelo azul, ¡pero ciertamente no se parece en nada a lo que describe el OP! El rojo está mucho más cerca de la situación presentada en la pregunta.
No veo ninguna razón para que sean "aproximadamente iguales" en general, pero ¿qué quiere decir exactamente con aproximadamente igual?
Aquí hay un ejemplo de juguete:
La imagen:
El modelo "azul" sería mucho mejor si se le permitiera tener un término de intercepción (es decir, constante) ...
fuente