Contexto : Quiero trazar una línea en un diagrama de dispersión que no aparece paramétrico, por lo tanto, estoy usando geom_smooth()en ggploten R. Devuelve automáticamente. geom_smooth: method="auto" and size of largest group is >=1000, so using gam with formula: y ~ s(x, bs = "cs"). Use 'method = x' to change the smoothing method.Supongo que GAM significa modelos aditivos generalizados y utiliza una spline cúbica.
¿Son correctas las siguientes percepciones?
Loess estima la respuesta a valores específicos.
Las splines son aproximaciones que conectan diferentes funciones por partes que se ajustan a los datos (que forman el modelo aditivo generalizado), y las splines cúbicas son el tipo específico de spline utilizado aquí.
Por último, ¿cuándo se deben usar splines, cuándo se debe usar LOESS?

gamfunción es la del paquetegam, en realidad realizará splines y suavizado polinomial local; LOESS es una implementación particular de suavizado polinomial local con algunas cosas adicionales agregadas (como atenuar los residuos grandes).Respuestas:
Lo que más importa es la cantidad de grados efectivos de libertad que le da a cada enfoque. Para los suavizadores no paramétricos, como loess, esto se controla mediante el ancho de banda, mientras que para las splines de regresión, los df son más obvios y se gasta un df por cada nudo agregado. Tanto loess y splines están estimando relaciones entre y . Las splines son más generales en el sentido de que pueden usarse en una mayor variedad de contextos.X Y
fuente