Me gustaría saber las diferencias entre la Regresión logística aleatoria (RLR) y la Regresión logística simple (LR), por lo tanto, estoy leyendo un artículo "Selección de estabilidad" de Meinshausen, et al. ; Sin embargo, no entiendo qué es RLR y cuáles son las diferencias entre RLR y LR.
¿Alguien podría señalar lo que debería leer para entender RLR? ¿O hay un ejemplo simple para comenzar?
machine-learning
logistic
Hendra Bunyamin
fuente
fuente
Respuestas:
Es posible que desee consultar esta referencia . Sci-kit learn implementa la regresión logística aleatoria y el método se describe allí.
Pero para responder a su pregunta, los dos métodos difieren en gran medida en sus objetivos. La regresión logística se trata de ajustar un modelo y RLR se trata de encontrar las variables que entran en el modelo.
La regresión logística de vainilla es un modelo lineal generalizado. Para una respuesta binaria, postulamos que las probabilidades de registro de la probabilidad de respuesta es una función lineal de varios predictores. Los coeficientes de los predictores se estiman utilizando la máxima probabilidad y la inferencia sobre los parámetros se basa en grandes propiedades de muestra del modelo. Para obtener los mejores resultados, generalmente suponemos que el modelo es bastante simple y bien entendido. Sabemos qué variables independientes impactan la respuesta. Queremos estimar los parámetros del modelo.
Por supuesto, en la práctica, no siempre sabemos qué variables deben incluirse en el modelo. Esto es especialmente cierto en situaciones de aprendizaje automático donde el número de variables explicativas potenciales es enorme y sus valores son escasos.
A lo largo de los años, muchas personas han intentado utilizar las técnicas de ajuste de modelos estadísticos con el propósito de seleccionar variables (leer "características"). En un nivel de confiabilidad creciente:
fuente