R al cuadrado y regresión polinómica de orden superior

8

La siguiente gráfica muestra la saturación de una carretera contra el impacto en el tiempo de viaje (normalizado a tiempo de viaje de flujo libre).

La curva azul (función BPR) presenta un modelo estandarizado utilizado en el campo para relacionar el tiempo de viaje y la saturación.

Para los datos empíricos que reuní, tracé un ajuste polinómico de tercer orden, que se muestra en rojo. Para evaluar este ajuste, encontré elR2para este ajuste de tercer orden. Esto se dio como 0,72.

Hablé con un colega sobre R2y él me señaló este artículo. ¿Por qué no hay R-cuadrado para la regresión no lineal?

He encontrado muchos artículos fueron R2 se usa para evaluar el ajuste de un polinomio de orden superior y ahora estoy bastante confundido.

Es R2inapropiado en este caso? ¿Qué debo usar en su lugar?

ingrese la descripción de la imagen aquí

Aprendizaje lento
fuente
55
La regresión polinómica es lineal: son los coeficientes los que determinan la linealidad del modelo, no la matriz del modelo. En realidad, mira esta fantástica publicación . Así que creo que estás en el camino correcto.
Antoni Parellada
Gracias @AntoniParellada. Eso hizo una excelente lectura. También estoy egoístamente contento ya que no necesito rehacer algunos análisis;)
LearningSlowly

Respuestas:

5

Considere un polinomio:

β0 0+β1X+β2X2+...+βkXk

Observe que el polinomio es no lineal en Xpero que es lineal enβ. Si estamos tratando de estimar , ¡esta es una regresión lineal! Linealidad en es lo que importa Al estimar la ecuación anterior por mínimos cuadrados, todos los resultados de la regresión lineal se mantendrán.β

yyo=β0 0+β1Xyo+β2Xyo2+...+βkXyok+ϵyo
β=(β0 0,β1,...,βk)

Sea la suma total de los cuadrados, la suma explicada de los cuadrados y la suma residual de los cuadrados. El coeficiente de determinación se define como:SSTSSmiSSR R2

R2=1-SSRSST

Y el resultado de la regresión lineal que le da a su interpretación familiar como la fracción de varianza explicada por el modelo.SST=SSmi+SSRR2

SST = SSE + SSR: ¿Cuándo es cierto y cuándo no?

Deje que sea ​​el valor de pronóstico de y deje que sea ​​el residuo. Además, definamos el valor de pronóstico degradado como .y^yoyyomiyo=yyo-y^yoFyo=y^yo-y¯

Let denota un producto interno . Trivialmente tenemos: Observe que es un producto interno válido. Entonces nosotros tenemos:.,.

F+mi,F+mi=F,F+2F,mi+mi,mi=F,F+mi,miSi F y mi ortogonales, es decir, su producto interno es 0
una,si=younayosiyo
  • F+mi,F+mi=yo(yyo-y¯)2 es la suma total de cuadrados (SST).
  • F,F=yo(y^yo-y¯)2 es la suma explicada de cuadrados (SSE).
  • mi,mi=yo(yyo-y^yo)2 es la suma residual de cuadrados (SSR).

Por lo tanto, es verdadero si el pronóstico degradado es ortogonal al residual . Esto es cierto en la regresión lineal de mínimos cuadrados ordinarios siempre que se incluya una constante en la regresión. Otra interpretación de los mínimos cuadrados ordinarios es que estás proyectando en el tramo lineal de los regresores, por lo tanto, el residuo es ortogonal a ese espacio por construcción. La ortogonalidad de las variables y residuos del lado derecho no es en general cierta para los pronósticos obtenidos de otras maneras.SST=SSmi+SSRFmi yy^yo

Matthew Gunn
fuente