La situación
Tengo un conjunto de datos con una dependiente una variable independiente . Quiero ajustar una regresión lineal continua por partes con puntos de interrupción conocidos / fijos que ocurren en . Los breakpoins se conocen sin incertidumbre, por lo que no quiero estimarlos. Luego ajusto una regresión (OLS) de la forma Aquí hay un ejemplo enk ( a 1 , a 2 , … , a k ) y i = β 0 + β 1 x i + β 2 max ( x i - a 1 , 0 ) + β 3 max ( x i - a 2 , 0 ) + … + Β k + 1 máx. ( X i
R
set.seed(123)
x <- c(1:10, 13:22)
y <- numeric(20)
y[1:10] <- 20:11 + rnorm(10, 0, 1.5)
y[11:20] <- seq(11, 15, len=10) + rnorm(10, 0, 2)
Supongamos que el punto de interrupción ocurre en : 9.6
mod <- lm(y~x+I(pmax(x-9.6, 0)))
summary(mod)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 21.7057 1.1726 18.511 1.06e-12 ***
x -1.1003 0.1788 -6.155 1.06e-05 ***
I(pmax(x - 9.6, 0)) 1.3760 0.2688 5.120 8.54e-05 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
La intersección y la pendiente de los dos segmentos son: y para el primero y y para el segundo, respectivamente.- 1,1 8,5 0,27
Preguntas
- ¿Cómo calcular fácilmente la intersección y la pendiente de cada segmento? ¿Se puede reparemetrizar el modelo para hacer esto en un cálculo?
- ¿Cómo calcular el error estándar de cada pendiente de cada segmento?
- ¿Cómo probar si dos pendientes adyacentes tienen las mismas pendientes (es decir, si se puede omitir el punto de ruptura)?
fuente
x
yI(pmax(x-9.6,0))
, ¿es correcto?Mi enfoque ingenuo, que responde a la pregunta 1:
Pero no estoy seguro de si las estadísticas (en particular, los grados de libertad) se realizan correctamente, si lo hace de esta manera.
fuente