Entiendo que una de las razones por las que la regresión logística se usa con frecuencia para predecir las tasas de clics en la web es que produce modelos bien calibrados. ¿Hay una buena explicación matemática para esto?
regression
logistic
lsankar4033
fuente
fuente
Respuestas:
Si.
El vector de probabilidad pronosticado de la regresión logística satisface la ecuación matricialpag
Especializada en la columna de intercepción (que es una fila en la matriz transpuesta), la ecuación lineal asociada es
entonces el promedio general de probabilidad pronosticada es igual al promedio de la respuesta.
fuente
Creo que puedo proporcionarle una explicación fácil de entender de la siguiente manera:
m
Eso significa que si el modelo está completamente entrenado, las probabilidades predichas que obtenemos para el conjunto de entrenamiento se extienden de manera que para cada característica la suma de los valores ponderados (todos) de esa característica es igual a la suma de los valores de esa característica de las muestras positivas.
Obviamente podemos ver que la regresión logística está bien calibrada.
Referencia: modelos logarítmicos lineales y campos aleatorios condicionales de Charles Elkan
fuente