GAM vs LOESS vs splines

14

Contexto : Quiero trazar una línea en un diagrama de dispersión que no aparece paramétrico, por lo tanto, estoy usando geom_smooth()en ggploten R. Devuelve automáticamente. geom_smooth: method="auto" and size of largest group is >=1000, so using gam with formula: y ~ s(x, bs = "cs"). Use 'method = x' to change the smoothing method.Supongo que GAM significa modelos aditivos generalizados y utiliza una spline cúbica.

¿Son correctas las siguientes percepciones?

  • Loess estima la respuesta a valores específicos.

  • Las splines son aproximaciones que conectan diferentes funciones por partes que se ajustan a los datos (que forman el modelo aditivo generalizado), y las splines cúbicas son el tipo específico de spline utilizado aquí.

Por último, ¿cuándo se deben usar splines, cuándo se debe usar LOESS?

Andrew Marderstein
fuente
3
si la gamfunción es la del paquete gam, en realidad realizará splines y suavizado polinomial local; LOESS es una implementación particular de suavizado polinomial local con algunas cosas adicionales agregadas (como atenuar los residuos grandes).
Glen_b -Reinstala a Mónica el

Respuestas:

17

Lo que más importa es la cantidad de grados efectivos de libertad que le da a cada enfoque. Para los suavizadores no paramétricos, como loess, esto se controla mediante el ancho de banda, mientras que para las splines de regresión, los df son más obvios y se gasta un df por cada nudo agregado. Tanto loess y splines están estimando relaciones entre y . Las splines son más generales en el sentido de que pueden usarse en una mayor variedad de contextos.XY

Frank Harrell
fuente