Estoy interesado en predecir Y
y estoy estudiando diferentes técnicas de medición X1
y X2
. Podría ser, por ejemplo, que quiero predecir el sabor de un plátano, ya sea midiendo cuánto tiempo ha estado sobre la mesa o midiendo la cantidad de manchas marrones en el plátano.
Quiero saber cuál de las técnicas de medición es mejor, si elijo realizar solo una.
Puedo crear un modelo lineal en R:
m1 = lm(Y ~ X1)
m2 = lm(Y ~ X2)
Ahora digamos que X1
es un predictor superior de sabor a plátano que X2
. Al calcular el de los dos modelos, el del modelo es claramente más alto que el modelo . Antes de escribir un artículo sobre cómo es mejor el método , quiero tener algún tipo de indicación de que la diferencia no es casual, posiblemente en forma de un valor p.m1
m2
X1
X2
¿Cómo se podría hacer esto? ¿Cómo hacerlo cuando estoy usando diferentes marcas de plátanos y pasar a un modelo de efecto mixto lineal que incorpora la marca de plátanos como un efecto aleatorio?
X1
yX2
probablemente estaría correlacionado, ya que las manchas marrones probablemente aumenten con el aumento del tiempo sobre la mesa.Respuestas:
Más tarde
Una cosa que quiero agregar después de escuchar que tiene modelos lineales de efectos mixtos: el y todavía se pueden usar para comparar los modelos. Ver este artículo , por ejemplo. De otras preguntas similares en el sitio, parece que este documento es crucial.Un yoC, A ICC B IC
Respuesta original
Lo que básicamente quiere es comparar dos modelos no anidados. La selección de modelos de Burnham y Anderson y la inferencia multimodelo discuten esto y recomiendan el uso de , o etc., ya que la prueba de razón de probabilidad tradicional solo es aplicable en modelos anidados. Indican explícitamente que los criterios teóricos de la información, como el etc. no son pruebas y que la palabra "significativo" debe evitarse al informar los resultados.Un yoC Un yoCC B IC Un yoC, A ICC, B IC
Basado en esto y en estas respuestas, recomiendo estos enfoques:
pairs(Y~X1+X2, panel = panel.smooth, lwd = 2, cex = 1.5, col = "steelblue", pch=16)
. Compruebe si las líneas (los suavizadores) son compatibles con una relación lineal. Refina el modelo si es necesario.m1
ym2
. Haga algunas comprobaciones del modelo (residuos, etc.):plot(m1)
yplot(m2)
.R
pscl
AICc
abs(AICc(m1)-AICc(m2))
R
paquetelmtest
tiene las funcionescoxtest
(prueba de Cox),jtest
( prueba de Davidson-MacKinnon J) yencomptest
(prueba de Davidson y MacKinnon).Algunas reflexiones: si las dos medidas de banano realmente miden lo mismo, ambas pueden ser igualmente adecuadas para la predicción y puede que no haya un "mejor" modelo.
Este documento también puede ser útil.
Aquí hay un ejemplo en
R
:Los suavizadores confirman las relaciones lineales. Esto estaba destinado, por supuesto.
El del primer modelo es claramente más bajo y el es mucho más alto.Un yoCC R2
m1
Importante: en modelos lineales de igual complejidad y distribución de errores gaussianos , y deberían dar las mismas respuestas (ver esta publicación ). En los modelos no lineales , se debe evitar el uso de para el rendimiento del modelo (bondad de ajuste) y la selección del modelo : consulte esta publicación y este documento , por ejemplo.R2, A IC B IC R2
fuente
lmtest
paquete. Antes de sumergirme en la literatura escrita sobre pruebas tipo cox con LME, ¿alguien conoce un paquete R disponible para hacerlo?R
paquete que pueda hacer eso. Quizás esta publicación pueda darte más orientación.Aquí hay una buena respuesta del siglo XIX en riesgo de negligencia. Para comparar dos ajustes de línea recta diferentes, trace los datos y las líneas ajustadas y piense en lo que ve. Es muy probable que un modelo sea claramente mejor, y eso no necesariamente significa más altoR2 . Por ejemplo, es posible que un modelo lineal sea cualitativamente incorrecto en uno u otro caso. Aún mejor, los datos y el ajuste pueden sugerir un mejor modelo. Si los dos modelos parecen igualmente buenos o malos, esa es otra respuesta.
El ejemplo del plátano es presumiblemente gracioso aquí, pero no esperaría que los ajustes en línea recta funcionen bien ...
La maquinaria inferencial extraída por otros en respuesta es una cosa de belleza intelectual, pero a veces no se necesita un mazo de última generación para romper una nuez. A veces parece que cualquiera que publique esa noche es más oscuro que el día siempre tendría a alguien preguntando "¿Lo ha probado formalmente? ¿Cuál es su valor P?".
fuente
Haga una prueba de Cox para modelos no anidados.
(encontrará referencias a otras pruebas).
Vea también este comentario y esta pregunta . En especial, considere usar AIC / BIC.
fuente