Actualmente estoy estudiando sobre Regresión logística. Pero me estoy en el cálculo de la intercepción ( ) y el coeficiente ( ). Lo he estado buscando a través de Internet, pero solo obtengo tutoriales usando Microsoft Excel o funciones integradas en R. Escuché que se puede resolver con Maximum Likelihood, pero no entiendo cómo usarlo, porque no No tiene antecedentes estadísticos. ¿Alguien puede darme una breve explicación y simulación para calcular los coeficientes manualmente?
regression
machine-learning
logistic
maximum-likelihood
Kadek Dwi Budi Utama
fuente
fuente
Respuestas:
Desafortunadamente, a diferencia de la regresión lineal, no existe una fórmula simple para la estimación de máxima probabilidad de regresión logística. Tendrá que realizar algún tipo de algoritmo de optimización, como descenso de gradiente o mínimos cuadrados reponderados de forma iterativa .
fuente
Me gustaría proponer mi método y espero que ayude.
Para calcular los coeficientes manualmente, debe tener algunos datos, o decir restricciones. En la regresión logística, en realidad es cómo se define la función logística a través de la entropía máxima y los multiplicadores de lagrange, esta restricción debe cumplirse con otras dos:mipagsFj=mipags^Fj . Es decir, la expectativa del modelo debe coincidir con la expectativa observada , que se ha ilustrado en este documento . Es por eso que la función logit como función de enlace en la regresión logística también se denomina función media.
Tomemos, por ejemplo, la siguiente tabla de referencias cruzadas que muestra cuántos hombres / mujeres hay en la clase de honor.
Como se ha mencionado más arriba∑yoyyoXyo j=∑yopagsyoXyo j sostiene. El lado izquierdo (LHS) es la expectativa de las observaciones (y en la muestra) y el lado derecho (RHS) es la expectativa del modelo.
Asumiendo que la función esl o g(pags1 - p) =β0 0+β1Xyo o equivalente p =11 +mi- (β0 0+β1∗Xyo) (Xyo representa la característica de que la observación es una mujer, es 1 si la observación es una mujer y 0 en caso contrario), obviamente sabemos que las siguientes dos ecuaciones se mantienen respectivamente cuando X= 1 y cuando X= 0 con los datos que se muestran arriba:
Entonces la intercepción (β0 0 ) es -1.47 y el coeficiente (β1 ) es 0.593. Puedes obtenerlo manualmente.
En la misma línea, puede calcular manualmente los coeficientes de otros modelos de regresión logística (se aplica también a la regresión softmax pero está fuera del alcance de esta pregunta) si se proporcionan suficientes datos.
Espero tener razón, si no, házmelo saber. Gracias.
fuente