Tomemos el siguiente ejemplo:
set.seed(342)
x1 <- runif(100)
x2 <- runif(100)
y <- x1+x2 + 2*x1*x2 + rnorm(100)
fit <- lm(y~x1*x2)
Esto crea un modelo de y basado en x1 y x2, utilizando una regresión OLS. Si deseamos predecir y para un x_vec dado, simplemente podríamos usar la fórmula que obtenemos de summary(fit)
.
Sin embargo, ¿qué pasa si queremos predecir las predicciones inferior y superior de y? (para un nivel de confianza dado).
¿Cómo entonces construiríamos la fórmula?
r
regression
predictive-models
prediction-interval
Tal Galili
fuente
fuente
Respuestas:
Necesitará aritmética matricial. No estoy seguro de cómo irá Excel con eso. De todos modos, aquí están los detalles.
Suponga que su regresión se escribe como .y = X β+ e
Sea un vector de fila que contiene los valores de los predictores para los pronósticos (en el mismo formato que X ). A continuación, el pronóstico es dada por Y = X * β = X * ( X ' X ) - 1 X ' Y con una varianza asociada σ 2 [ 1 + X * ( X ' X ) - 1 ( X * ) ' ] .X∗ X
fuente
¿Estás por casualidad después de los diferentes tipos de intervalos de predicción? La
predict.lm
página del manual tieney
¿Eso es lo que tenías en mente?
fuente
@Tal: ¿Puedo sugerir a Kutner et al como una fuente fabulosa para modelos lineales?
fuente