¿Cuál es la diferencia entre los términos 'función de enlace' y 'función de enlace canónico'? Además, ¿hay alguna ventaja (teórica) de usar uno sobre el otro?
Por ejemplo, una variable de respuesta binaria se puede modelar usando muchas funciones de enlace como logit , probit , etc. Pero, logit aquí se considera la función de enlace "canónico".
logistic
generalized-linear-model
link-function
pescado estable
fuente
fuente
Respuestas:
Las respuestas anteriores son más intuitivas, por lo que intento más rigor.
¿Qué es un GLM?
Por lo tanto, tienden a usarse por defecto. Sin embargo, tenga en cuenta que no existe una razón a priori por la cual los efectos en el modelo deberían ser aditivos en la escala dada por este o cualquier otro enlace.
fuente
Gung ha citado una buena explicación: el enlace canónico posee propiedades teóricas especiales de mínima suficiencia. Esto significa que puede definir un modelo logit condicional (que los economistas llaman un modelo de efecto fijo) al condicionar el número de resultados, pero no puede definir un modelo probit condicional, porque no hay suficientes estadísticas para usar con el enlace probit.
fuente
Aquí hay un pequeño diagrama inspirado en la clase 18.650 del MIT que encuentro bastante útil ya que ayuda a visualizar las relaciones entre estas funciones. He usado la misma notación que en la publicación de @momo:
El diagrama permite ir fácilmente de una dirección a otra, por ejemplo:
Función de enlace canónico
fuente
Las respuestas anteriores ya han cubierto lo que quiero decir. Solo para aclarar algunos puntos como investigador del aprendizaje automático:
La función de enlace no es más que la inversa de la función de activación. Por ejemplo, logit es el inverso de sigmoide, probit es el inverso de la función de distribución acumulativa de Gauss.
La discusión anterior no tiene nada que ver con la familia exponencial, pero se puede encontrar una buena discusión en el libro PRML de Christopher Bishop, Capítulo 4.3.6.
fuente