La regresión logística es la regresión, ante todo. Se convierte en un clasificador al agregar una regla de decisión. Daré un ejemplo que va hacia atrás. Es decir, en lugar de tomar datos y ajustar un modelo, voy a comenzar con el modelo para mostrar cómo este es realmente un problema de regresión.
En la regresión logística, estamos modelando las probabilidades de registro, o logit, de que ocurra un evento, que es una cantidad continua. Si la probabilidad de que ocurra el evento es P ( A ) , las probabilidades son:UNPAGS( A )
PAGS( A )1 - P( A )
Las probabilidades de registro, entonces, son:
Iniciar sesión( P(A )1- P( A ))
Como en la regresión lineal, modelamos esto con una combinación lineal de coeficientes y predictores:
logit = b0 0+ b1X1+ b2X2+ ⋯
Imagine que se nos da un modelo de si una persona tiene canas. Nuestro modelo usa la edad como el único predictor. Aquí, nuestro evento A = una persona tiene canas:
probabilidades de registro de canas = -10 + 0.25 * edad
...¡Regresión! Aquí hay un código de Python y una trama:
%matplotlib inline
import matplotlib.pyplot as plt
import numpy as np
import seaborn as sns
x = np.linspace(0, 100, 100)
def log_odds(x):
return -10 + .25 * x
plt.plot(x, log_odds(x))
plt.xlabel("age")
plt.ylabel("log odds of gray hair")
PAGS( A )
PAGS( A ) = 11 + exp( - probabilidades de registro ) )
Aquí está el código:
plt.plot(x, 1 / (1 + np.exp(-log_odds(x))))
plt.xlabel("age")
plt.ylabel("probability of gray hair")
PAGS( A ) > 0.5
La regresión logística también funciona muy bien como clasificador en ejemplos más realistas, pero antes de que pueda ser un clasificador, ¡debe ser una técnica de regresión!
Respuesta corta
Sí, la regresión logística es un algoritmo de regresión y predice un resultado continuo: la probabilidad de un evento. Que lo usemos como clasificador binario se debe a la interpretación del resultado.
Detalle
La regresión logística es un tipo de modelo de regresión lineal generalizado.
En un modelo de regresión lineal ordinario, un resultado continuo
y
, se modela como la suma del producto de predictores y su efecto:donde
e
esta el errorLos modelos lineales generalizados no modelan
y
directamente. En cambio, usan transformaciones para expandir el dominio dey
todos los números reales. Esta transformación se llama función de enlace. Para la regresión logística, la función de enlace es la función logit (generalmente, vea la nota a continuación).La función logit se define como
Así, la forma de regresión logística es:
donde
y
es la probabilidad de un eventoEl hecho de que lo usemos como clasificador binario se debe a la interpretación del resultado.
Nota: probit es otra función de enlace utilizada para la regresión logística, pero logit es la más utilizada.
fuente
Mientras discute la definición de regresión está prediciendo una variable continua. La regresión logística es un clasificador binario. La regresión logística es la aplicación de una función logit en la salida de un enfoque de regresión habitual. La función Logit convierte (-inf, + inf) en [0,1]. Creo que es solo por razones históricas que mantiene ese nombre.
Al decir algo como "Hice una regresión para clasificar las imágenes. En particular, usé regresión logística". Está Mal.
fuente
En pocas palabras, cualquier función hipotéticaF hace para el algoritmo de regresión si F: X→ R . Por lo tanto, la función logística que esPAGS( Y= 1 | λ , x ) = 11 + e- λTX∈ [ 0 , 1 ] hace un algoritmo de regresión. aquíλ es el coeficiente o hiperplano encontrado de conjuntos de datos entrenados y X Es un punto de datos. Aquí,s i gn ( P( Y= 1 | λ , x ) ) Se toma como clase.
fuente