Estoy usando regresión lineal múltiple para describir las relaciones entre Y y X1, X2.
Desde la teoría, entendí que la regresión múltiple supone relaciones lineales entre Y y cada una de X (Y y X1, Y y X2). No estoy usando ninguna transformación de X.
Entonces, obtuve el modelo con R = 0.45 y todo X significativo (P <0.05). Luego tracé Y contra X1. No entiendo por qué los círculos de color rojo que son predicciones del modelo no forman una línea. Como dije antes, esperaba que cada par de Y y X esté ajustado por una línea.
La trama se genera en python de esta manera:
fig, ax = plt.subplots()
plt.plot(x['var1'], ypred, 'o', validation['var1'], validation['y'], 'ro');
ax.set_title('blue: true, red: OLS')
ax.set_xlabel('X')
ax.set_ylabel('Y')
plt.show()
regression
multiple-regression
python
linear
Klausos
fuente
fuente
Respuestas:
Suponga que su ecuación de regresión múltiple fue
donde Y significa "predicho y ".y^ y
Ahora tome solo aquellos puntos para los cuales . Entonces, si se trazan y contra x 1 , estos puntos va a satisfacer la ecuación:x2=1 y^ x1
Por lo tanto, deben recostarse en una línea de pendiente 2 y con la intersección 8.y
Ahora tome esos puntos para los cuales . Al trazar y contra x 1 , entonces estos puntos satisfacen:x2=2 y^ x1
Entonces, esa es una línea de pendiente 2 y con la intersección 13. Puedes verificar por ti mismo que si x 2 = 3 obtienes otra línea de pendiente 2 y la intersección y es 18.y x2=3 y
Vemos que los puntos con diferentes valores de se ubicarán en diferentes líneas, pero todos con el mismo gradiente: el significado del coeficiente de 2 x 1 en la ecuación de regresión original es que, ceteris paribus, es decir, mantener otros predictores constantes, uno unidad de aumento en x 1 aumenta la respuesta media predicha y por dos unidades, mientras que el significado de la intersección de 3 en la ecuación de regresión fue que cuando x 1 = 0 y x 2 = 0 entonces la respuesta media predicha es 3x2 2x1 x1 y^ 3 x1=0 x2=0 3 . Pero no todos sus puntos tienen el mismo , lo que significa que se encuentran en líneas con una intersección diferente: la línea solo tendría la intersección 3 para aquellos puntos para los cuales x 2 = 0 . Entonces, en lugar de ver una sola línea, puede ver (si solo hay ciertos valores de x 2 que ocurren, por ejemplo, si x 2 es siempre entero) una serie de "rayas" diagonales. Tenga en cuenta los siguientes datos, en donde y = 2 x 1 + 5 x 2 + 3 .x2 3 x2=0 x2 x2 y^=2x1+5x2+3
Aquí hay "rayas" perceptibles. Ahora, si coloreo aquellos puntos para los cuales como círculos rojos, x 2 = 2 como triángulos dorados y x 2 = 3 como cuadrados azules, vemos que se encuentran en tres líneas distintas, todas de pendiente 2, e interceptos en y 8, 13 y 18 como se calculó anteriormente. Por supuesto, si x 2 no estuviera limitado a tomar valores enteros, o la situación se complicara por otras variables predictoras que se incluyen en la regresión, entonces el rayado diagonal sería menos claro, pero aún sería el caso de que cada punto predicho se encuentra en una línea separadax2=1 x2=2 x2=3 y x2 basado en los valores de los otros predictores que no se muestran en el gráfico .
Código para parcelas R
fuente