La definición de splines cúbicos naturales para regresión

16

Estoy aprendiendo sobre splines del libro "Los elementos de la minería de datos estadísticos de aprendizaje, inferencia y predicción" de Hastie et al. En la página 145 descubrí que las estrías cúbicas naturales son lineales más allá de los nudos de límite. Hay K nudos, en las splines y se da lo siguiente sobre dicha spline en el libro.ξ1,ξ2,...ξKingrese la descripción de la imagen aquí

Pregunta 1: ¿Cómo se liberan 4 grados de libertad? No entiendo esta parte.

Pregunta 2 : En la definición de cuando entonces . ¿Qué intenta hacer el autor en esta fórmula? ¿Cómo ayuda esto a asegurarse de que las splines sean lineales más allá de los nudos límite?dk(X)k=KdK(X)=00

Durin
fuente

Respuestas:

17
  1. Comencemos considerando las splines cúbicas ordinarias. Son cúbicos entre cada par de nudos y cúbicos fuera de los nudos límite. Comenzamos con 4df para el primer cúbico (a la izquierda del primer nudo límite), y cada nudo agrega un nuevo parámetro (porque la continuidad de las splines cúbicas y las derivadas y las segundas derivadas agrega tres restricciones, dejando un parámetro libre), haciendo un total de Parámetros para K nudos.K+4K

    Una spline cúbica natural es lineal en ambos extremos. Esto limita las piezas cúbicas y cuadráticas allí a 0, cada reducción de la df por 1. Eso es 2 df en cada uno de dos extremos de la curva, la reducción de a K .K+4K

    Imagine que decide que puede gastar un número total de grados de libertad ( , por ejemplo) en su estimación de curva no paramétrica. Dado que la imposición de una spline natural usa 4 grados menos de libertad que una spline cúbica ordinaria (para el mismo número de nudos), con esos parámetros p puede tener 4 nudos más (y 4 parámetros más) para modelar la curva entre los nudos de límite .pp

  2. Obsérvese que la definición de es para k = 1 , 2 , . . . , K - 2 (ya que hay K funciones básicas en todos). Entonces, la última función básica en esa lista, N K = d K - 2 - d K - 1 . Entonces, la k más alta necesaria para las definiciones de d k es para k = K - 1Nk+2k=1,2,...,K2KNK=dK2dK1kdkk=K1. (Es decir, no necesitamos tratar de averiguar qué podría hacer , ya que no lo usamos).dK

Glen_b -Reinstate a Monica
fuente
4

2ξ1,ξ2],ξ1[]ξ1,ξ2[]ξ2,+[|I|=3|I|1=2 nudos)

Para splines cúbicas (comunes)

Sin restricciones de regularidad, tenemos ecuaciones:4|I|=12

1 ( ξ 1X < ξ 2 ) ; 1 ( ξ 1X < ξ 2 ) X ; 1

1(X<ξ1)  ;  1(X<ξ1)X  ;  1(X<ξ1)X2  ;  1(X<ξ1)X3  ;
1 ( ξ 2X ) ; 1 ( ξ 2X ) X ; 1 ( ξ 2X ) X 2 ; 1 ( ξ 2X ) X 3
1(ξ1X<ξ2)  ;  1(ξ1X<ξ2)X  ;  1(ξ1X<ξ2)X2  ;  1(ξ1X<ξ2)X3  ;
1(ξ2X)  ;  1(ξ2X)X  ;  1(ξ2X)X2  ;  1(ξ2X)X3.

Crr=2(r+1)×(El |yoEl |-1)=3×(El |yoEl |-1)=6 6

12-6 6=6 6

Para splines cúbicos naturales

"Un splines cúbicos naturales agrega restricciones adicionales, es decir, que la función es lineal más allá de los nudos de límite".

4 4El |yoEl |-4 4=12-4 44 42

1(X<ξ1)  ;  1(X<ξ1)X  ;  
1(ξ1X<ξ2)  ;  1(ξ1X<ξ2)X  ;  1(ξ1X<ξ2)X2  ;  1(ξ1X<ξ2)X3  ;
1(ξ2X)  ;  1(ξ2X)X.

3×(|I|1)=6

86=2

ahstat
fuente