Actualmente estoy escribiendo un artículo con varios análisis de regresión múltiple. Si bien visualizar una regresión lineal univariante es fácil a través de diagramas de dispersión, me preguntaba si hay alguna buena manera de visualizar regresiones lineales múltiples.
Actualmente solo estoy trazando diagramas de dispersión como variable dependiente frente a primera variable independiente, luego frente a segunda variable independiente, etc. Realmente agradecería cualquier sugerencia.
regression
data-visualization
multiple-regression
Shawn Wang
fuente
fuente
effects
paquete enR
Respuestas:
No hay nada malo con tu estrategia actual. Si tiene un modelo de regresión múltiple con solo dos variables explicativas, entonces podría intentar hacer un diagrama 3D que muestre el plano de regresión predicho, pero la mayoría de los programas no lo hacen fácil. Otra posibilidad es usar una trama (ver también: trama en R o este pdf ), que puede representar tres o incluso cuatro variables, pero muchas personas no saben cómo leerlas. Esencialmente, sin embargo, si no tiene ninguna interacción, entonces la relación marginal predicha entre e será la misma que la condicional predicha y x x y = β 0 + ⋯ + β j x j + ⋯ + β p ˉ x p ( x j , y ) pXj y relación (más o menos algún desplazamiento vertical) en cualquier nivel específico de sus otras variables . Por lo tanto, simplemente puede establecer todas las otras variables en sus medias y encontrar la línea pronosticada y trazar esa línea en un diagrama de dispersión de pares. Además, terminará con tales gráficos, aunque es posible que no incluya algunos de ellos si cree que no son importantes. (Por ejemplo, es común tener un modelo de regresión múltiple con una sola variable de interés y algunas variables de control, y solo presentar la primera gráfica de este tipo). X X y^= β^0 0+ ⋯ + β^jXj+ ⋯ + β^pagsX¯pags ( xj, y) pags
Por otro lado, si lo tienen interacciones, entonces usted debe averiguar cuál de las variables que interactúan que están más interesados en la parcela y la relación predicha entre esa variable y la variable de respuesta, pero con varias líneas en la misma parcela. La otra variable interactiva se establece en diferentes niveles para cada una de esas líneas. Los valores típicos serían la media y 1 SD de la variable interactuante. Para aclarar esto, imagine que solo tiene dos variables, y , y que tiene una interacción entre ellas, y que es el foco de su estudio, entonces podría hacer una sola gráfica con estas tres líneas:x 1 x 2 x 1 y± X1 X2 X1
fuente
Aquí hay una herramienta interactiva basada en la web para trazar resultados de regresión en tres dimensiones .
Este gráfico tridimensional funciona con una variable dependiente y dos variables explicativas. También puede establecer la intersección en cero (es decir, eliminar la intersección de la ecuación de regresión).
Los gráficos requieren un navegador compatible con WebGL. Las versiones más recientes de todos los principales navegadores de escritorio son compatibles con WebGL.
fuente
Para visualizar el modelo , en lugar de los datos, JMP utiliza un gráfico interactivo de "perfilador". Aquí hay una vista estática.
Y aquí hay un enlace a una vista dinámica .
Es similar a su idea de diagrama de dispersión y se puede combinar con ella. La idea es que cada cuadro muestre una porción del modelo para las variables X e Y correspondientes con las otras variables X mantenidas constantes en sus valores indicados. En la versión interactiva, los valores X se pueden cambiar arrastrando las líneas verticales rojas.
Divulgación: soy un desarrollador de JMP, así que no tome esto como un endoso imparcial.
fuente