Dado que el modelado de regresión es a menudo más "arte" que ciencia, a menudo me encuentro probando muchas iteraciones de una estructura de regresión. ¿Cuáles son algunas formas eficientes de resumir la información de estas ejecuciones de modelos múltiples en un intento por encontrar el "mejor" modelo? Un enfoque que he usado es poner todos los modelos en una lista y ejecutarla summary()
, pero ¿imagino que hay formas más eficientes de comparar?
Código de muestra y modelos:
ctl <- c(4.17,5.58,5.18,6.11,4.50,4.61,5.17,4.53,5.33,5.14)
trt <- c(4.81,4.17,4.41,3.59,5.87,3.83,6.03,4.89,4.32,4.69)
group <- gl(2,10,20, labels=c("Ctl","Trt"))
weight <- c(ctl, trt)
lm1 <- lm(weight ~ group)
lm2 <- lm(weight ~ group - 1)
lm3 <- lm(log(weight) ~ group - 1)
#Draw comparisions between models 1 - 3?
models <- list(lm1, lm2, lm3)
lapply(models, summary)
r
regression
Persecución
fuente
fuente
Respuestas:
Trazarlos!
http://svn.cluelessresearch.com/tables2graphs/longley.png
O, si es necesario, use tablas: el paquete apsrtable o la
mtable
función en el paquete memisc .Utilizando
mtable
fuente
grid
, nolattice
:)memisc
anteriormente, ¡parece un paquete muy útil para tener en el carcaj!Lo siguiente no responde exactamente la pregunta. Sin embargo, puede darte algunas ideas. Es algo que hice recientemente para evaluar el ajuste de varios modelos de regresión utilizando una a cuatro variables independientes (la variable dependiente estaba en la primera columna del marco de datos df1).
El contenido de as.character (formlist) era
Luego recolecté algunos índices útiles
El marco de datos final fue
Finalmente, un diagrama de Cp (usando la biblioteca wle)
fuente