En respuesta a una pregunta sobre la selección de modelos en presencia de multicolinealidad , Frank Harrell sugirió :
Ponga todas las variables en el modelo pero no pruebe el efecto de una variable ajustada por los efectos de las variables competidoras ... Las pruebas fragmentarias de las variables competidoras son poderosas porque las variables colineales unen fuerzas en la prueba general de asociación de grado múltiple de libertad, en lugar de compitiendo uno contra el otro como cuando pruebas variables individualmente.
¿Qué son las pruebas de fragmentos ? ¿Puedes dar un ejemplo de su aplicación en r
?
Respuestas:
@ mark999 proporcionó una excelente respuesta. Además de probar conjuntamente los términos polinómicos, puede probar conjuntamente ("prueba fragmentaria") cualquier conjunto de variables. Suponga que tiene un modelo con variables colineales en competencia circunferencia de tríceps, cintura, circunferencia de cadera, todas las medidas del tamaño del cuerpo. Para obtener una prueba general del tamaño del cuerpo, puede hacer
Puede obtener la misma prueba ajustando un modelo que contenga solo la edad (si no hayR2
NA
stricep, waist, hip
) y haciendo la "diferencia en la prueba ". Estas pruebas equivalentes no sufren incluso una colinealidad extrema entre las tres variables.fuente
El comentario de Macro es correcto, como el de Andy. Aquí hay un ejemplo.
En lugar de considerar los términos
x2
y porx2^2
separado, la "prueba fragmentaria" es la prueba 2-df que prueba la hipótesis nula de que los coeficientes de esos términos son ambos cero (creo que comúnmente se llama algo así como una "prueba F lineal general" ) El valor p para esa prueba es 0.0037 dado poranova(ols1)
.Tenga en cuenta que en el
rms
paquete, debe especificar losx2
términospol(x2, 2)
paraanova.rms()
saber que deben probarse juntos.anova.rms()
realizará pruebas similares para variables predictoras que se representan como splines cúbicas restringidas utilizando, por ejemplorcs(x2, 3)
, y para variables predictoras categóricas. También incluirá términos de interacción en los "fragmentos".Si quisiera hacer una prueba fragmentaria para variables predictoras "competidoras" generales, como se menciona en la cita, creo que tendría que hacerlo manualmente ajustando los dos modelos por separado y luego usándolos
anova(model1, model2)
. [Editar: esto es incorrecto - ver la respuesta de Frank Harrell.]fuente