¿Qué propiedades útiles tiene la función de enlace canónico?

Respuestas:

9

Sé que esta pregunta es bastante ingenua y simple, pero no sé exactamente por qué la función canónica del enlace es tan útil

¿Es realmente tan útil? Una función de enlace que es canónica es principalmente una propiedad matemática. Simplifica un poco las matemáticas, pero en el modelado, de todos modos, debe usar la función de enlace que tiene significado científico.

Entonces, ¿qué propiedades adicionales tiene una función de enlace canónico?

  1. Conduce a la existencia de suficientes estadísticas. Eso podría implicar una estimación algo más eficiente, tal vez, pero el software moderno (como glmen R) no parece tratar los enlaces canónicos de manera diferente a otros enlaces.

  2. Simplifica algunas fórmulas, por lo que se facilitan los desarrollos teóricos. Muchas buenas propiedades matemáticas, vea ¿Cuál es la diferencia entre una "función de enlace" y una "función de enlace canónico" para GLM ?

Entonces, las ventajas parecen ser principalmente matemáticas y algorítmicas, no realmente estadísticas.

Algunos detalles más: Let Y1,,Yn ser observaciones independientes del modelo de familia de dispersión exponencial

fY(y;θ,ϕ)=exp{(yθb(θ))/a(ϕ)+c(y,ϕ)}
con expectativa EYi=μi y predictor lineal ηi=xiTβ con vector covariable xi. La función de enlace es canónica siηi=θi. En este caso, la función de probabilidad se puede escribir como
L(β;ϕ)=exp{iyixiTβb(xiTβ)a(ϕ)+ic(yi,ϕ)}
y por el teorema de factorización podemos concluir queixiyi es suficiente para β.

Sin entrar en detalles, las ecuaciones necesarias para IRLS se simplificarán. Del mismo modo, esta búsqueda en Google parece encontrar principalmente enlaces canónicos mencionados en el contexto de las simplificaciones, y no más razones estadísticas.

kjetil b halvorsen
fuente
1
Es matemáticamente útil, tal vez.
AdamO
¡Sí, eso es lo que he tratado de decir!
kjetil b halvorsen
8

La función de enlace canónico describe la relación media-varianza en un GLM. Por ejemplo, una variable aleatoria binomial tiene función de enlaceμ=exp(ν)/(1exp(ν)) where ν is a linear predictor XTβ. Note that νμ=μ(1μ) which is the appropriate mean-variance relationship for a Bernoulli random variable. The same is true of Poisson random variables, where the inverse link function is μ=exp(ν) and νμ=μ where in a Poisson random variable, the variance is the mean.

The generalized linear model solves an estimating equation of the form:

S(β)=DV1(Yg(XTβ))

where D=βg(XTβ) and V=var(Y). When the link is canonical, therefore, D=V and the estimating function is:

S(β)=XT(Yg(XTβ))

As was noted in Wedderburn's 1976 paper on quasilikelihood, the canonical link has the advantage that expected and observed information are the same and that iteratively reweighted least squares is equivalent to Newton-Raphson, so this simplifies estimating procedures and variance estimation.

AdamO
fuente