Contexto : Quiero trazar una línea en un diagrama de dispersión que no aparece paramétrico, por lo tanto, estoy usando geom_smooth()
en ggplot
en R
. Devuelve automáticamente. geom_smooth: method="auto" and size of largest group is >=1000, so using gam with formula: y ~ s(x, bs = "cs"). Use 'method = x' to change the smoothing method.
Supongo que GAM significa modelos aditivos generalizados y utiliza una spline cúbica.
¿Son correctas las siguientes percepciones?
Loess estima la respuesta a valores específicos.
Las splines son aproximaciones que conectan diferentes funciones por partes que se ajustan a los datos (que forman el modelo aditivo generalizado), y las splines cúbicas son el tipo específico de spline utilizado aquí.
Por último, ¿cuándo se deben usar splines, cuándo se debe usar LOESS?
gam
función es la del paquetegam
, en realidad realizará splines y suavizado polinomial local; LOESS es una implementación particular de suavizado polinomial local con algunas cosas adicionales agregadas (como atenuar los residuos grandes).Respuestas:
Lo que más importa es la cantidad de grados efectivos de libertad que le da a cada enfoque. Para los suavizadores no paramétricos, como loess, esto se controla mediante el ancho de banda, mientras que para las splines de regresión, los df son más obvios y se gasta un df por cada nudo agregado. Tanto loess y splines están estimando relaciones entre y . Las splines son más generales en el sentido de que pueden usarse en una mayor variedad de contextos.X Y
fuente