Prueba de no linealidad en regresión logística (u otras formas de regresión)

13

Uno de los supuestos de la regresión logística es la linealidad en el logit. Entonces, una vez que tengo mi modelo en funcionamiento, pruebo la no linealidad con la prueba Box-Tidwell. Uno de mis predictores continuos (X) ha dado positivo por no linealidad. ¿Qué se supone que debo hacer a continuación?

Como se trata de una violación de los supuestos, me deshaceré del predictor (X) o incluiré la transformación no lineal (X * X). ¿O transformar la variable en categórica? Si tiene una referencia, ¿podría señalarme eso también?

tosonb1
fuente

Respuestas:

8

Sugeriría usar splines cúbicas restringidas ( rcsen R, vea los paquetes Hmisc y Design para ver ejemplos de uso), en lugar de agregar la potencia de en su modelo. Este enfoque es el recomendado por Frank Harrell, por ejemplo, y encontrará una buena ilustración en sus folletos (§2.5 y cap. 9) sobre Estrategias de modelado de regresión (consulte el sitio web complementario ).X

Puede comparar los resultados con la prueba de Box-Tidwell utilizando el boxTidwell()en el coche paquete.

Transformar predictores continuos en categóricos generalmente no es una buena idea, ver, por ejemplo, Problemas causados ​​por categorizar variables continuas .

chl
fuente
5

Se puede ser conveniente incluir una transformación no lineal de x , pero probablemente no simplemente x × x , es decir, x 2 . Creo que puede encontrar esto como una referencia útil para determinar qué transformación usar:

GEP Box y Paul W. Tidwell (1962). Transformación de las variables independientes. Technometrics, Volumen 4, Número 4, páginas 531-550. http://www.jstor.org/stable/1266288

Algunos consideran que la familia de transformaciones Box-Tidwell es más general de lo que suele ser apropiado para la interpretabilidad y la parsimonia. Patrick Royston y Doug Altman introdujeron el término polinomios fraccionales para transformaciones de Box-Tidwell con poderes racionales simples en un artículo influyente de 1994:

P. Royston y DG Altman (1994). Regresión utilizando polinomios fraccionales de covariables continuas: modelado paramétrico parsimonioso. Estadísticas Aplicadas Volumen 43: páginas 429–467. http://www.jstor.org/stable/2986270

Patrick Royston en particular ha continuado trabajando y publicando documentos y software sobre esto, culminando en un libro con Willi Sauerbrei:

P. Royston y W. Sauerbrei (2008). Construcción de modelos multivariables: un enfoque pragmático para el análisis de regresión basado en polinomios fraccionados para modelar variables continuas . Chichester, Reino Unido: Wiley. ISBN 978-0-470-02842-1

una parada
fuente
4

No olvide verificar las interacciones entre X y otras variables independientes. Dejar las interacciones sin modelar puede hacer que X parezca que tiene un efecto no lineal cuando simplemente tiene un efecto no aditivo.

conjugadoprior
fuente
Buen punto. Solo he encontrado lo contrario: suponer que un efecto es lineal cuando no lo es puede generar evidencia estadística espuria para términos de interacción multiplicativa.
parada el
1
@onestop, ¿tienes alguna referencia al respecto? Lo creo, pero tengo problemas para entender exactamente por qué sucedería eso.
Macro