Modelo lineal no lineal versus generalizado: ¿cómo se refiere a la regresión logística, de Poisson, etc.?

23

Tengo una pregunta sobre la semántica sobre la que me gustaría la opinión de otros estadísticos.

Sabemos que modelos como el logístico, Poisson, etc. se encuentran bajo el paraguas de modelos lineales generalizados. El modelo incluye funciones no lineales de los parámetros, que a su vez pueden modelarse utilizando el marco del modelo lineal utilizando la función de enlace apropiada.

Me pregunto si considera situaciones (¿enseñar?) Como la regresión logística como:

  1. Modelo no lineal, dada la forma de los parámetros
  2. Modelo lineal, ya que el enlace nos transforma en el marco del modelo lineal.
  3. Simultáneamente (1) y (2): "comienza" como un modelo no lineal, pero se puede trabajar de tal manera que nos permita pensar en él como un modelo lineal

Ojalá pudiera organizar una encuesta real ...

Meg
fuente

Respuestas:

24

Esta es una gran pregunta.

Sabemos que modelos como el logístico, Poisson, etc. se encuentran bajo el paraguas de modelos lineales generalizados.

Pues sí y no. Dado el contexto de la pregunta, debemos ser muy cuidadosos al especificar de qué estamos hablando, y "logística" y "Poisson" por sí solos son insuficientes para describir lo que se pretende.

(i) "Poisson" es una distribución. Como descripción de una distribución condicional, no es lineal (y por lo tanto no es un GLM) a menos que especifique un modelo lineal (en parámetros) para describir la media condicional (es decir, no es suficiente simplemente decir "Poisson"). Cuando las personas especifican "regresión de Poisson", casi siempre tienen la intención de un modelo que sea lineal en los parámetros y, por lo tanto, sea un GLM. Pero "Poisson" solo podría ser cualquier cantidad de cosas *.

(ii) "Logística", por otro lado, se refiere a la descripción de una media (que la media es logística en predictores). No es un GLM a menos que lo combine con una distribución condicional que esté en la familia exponencial. Cuando la gente dice " regresión logística " por otro lado, casi siempre se refieren a un modelo binomial con enlace logit; eso significa que es logístico en predictores, el modelo es lineal en parámetros y está en la familia exponencial, por lo que es un GLM.

El modelo incluye funciones no lineales de los parámetros,

Bueno, de nuevo, sí y no.

El lineal en el "modelo lineal generalizado" dice que los parámetros ingresan al modelo linealmente. Específicamente, lo que se quiere decir es que en la escala del predictor lineal , el modelo tiene la forma η = X β .η=sol(μ)η=Xβ

que a su vez puede modelarse utilizando el marco de modelo lineal utilizando la función de enlace apropiada.

Correcto

Me pregunto si considera situaciones (¿enseñar?) Como la regresión logística como:

(Estoy cambiando el orden de su pregunta aquí)

Modelo lineal, ya que el enlace nos transforma en el marco del modelo lineal.

Es convencional llamar a un GLM "lineal", precisamente por esta razón. De hecho, está bastante claro que esta es la convención, porque está justo ahí en el nombre .

Modelo no lineal, dada la forma de los parámetros

Debemos tener mucho cuidado aquí, porque "no lineal" generalmente se refiere a un modelo que no es lineal en parámetros. Contraste de regresión no lineal con modelos lineales generalizados.

Por lo tanto, si desea utilizar el término "no lineal" para describir un GLM, es importante especificar cuidadosamente lo que quiere decir, en general, que la media no está relacionada linealmente con los predictores.

De hecho, si usa "no lineal" para referirse a los GLM, tendrá dificultades no solo con la convención (y, por lo tanto, es probable que se le malinterprete), sino también cuando intente hablar sobre modelos no lineales generalizados . ¡Es un poco difícil explicar la distinción si ya caracterizó a los GLM como "modelos no lineales"!

sol(μ)

YPoisson(μX)

XYXμXX

μX=α+exp(βX).

Xα término , pero podemos plantear una situación en la que observemos una exposición constante. Tenga en cuenta que tanto los modelos de Poisson como los binomiales se usan para modelar la mortalidad).

Aquí el primer término representa una tasa de mortalidad constante debido a (digamos) accidentes (u otros efectos no muy relacionados con la edad) mientras que el segundo término tiene una tasa de mortalidad creciente debido a la edad. Tal modelo tal vez a veces sea factible en rangos cortos de edad adulta posterior pero no senescente; Es esencialmente la ley de Makeham (presentada como una función de riesgo, pero para la cual una tasa anualizada sería una aproximación razonable).

Ese es un modelo no lineal generalizado.

Glen_b -Reinstate a Monica
fuente
Gracias por tu contribución. Esto es a lo que estoy tratando de llegar. Obviamente "lineal" está en el nombre de GLM. Estoy tratando de clasificar aquellos modelos que son inherentemente no lineales (no son lineales en los parámetros), pero "transformablemente lineales", y por lo tanto caen dentro del marco GLM. Supongo que tal vez acabo de responder mi propia pregunta: la mejor manera de referirme a ellos es "transformablemente no lineal".
Meg
1
La forma más común de referirse a un modelo que puede transformarse en parámetros lineales mediante una transformación es "linealizable" (en contraste con "intrínsecamente no lineal"). Creo que debemos tener claro qué es lineal (frente a lo que no es lineal) al analizar el modelo, y quizás también tener claro cómo se hace referencia convencionalmente a esas cosas, ya que las personas deben poder localizar información y también ser entendidas cuando hablamos de ellos. Es probable que alguien que habla de GLM como "no lineal" sea malentendido, a menos que agregue los calificadores correctos que aclaren su significado.
Glen_b -Reinstate Monica
Estoy de acuerdo. Simplemente lo veo clasificado como regresión no lineal en los textos y mis profesores también me han enseñado que no es lineal. Personalmente, me resulta confuso ya que lo tratamos en el marco GLM, pero puedo (más o menos) empatizar con llamarlo. Creo que voy con linealizable / transformablemente lineal y una discusión de cómo llegamos del punto A al punto B (es decir, cómo comenzamos con una función no lineal y la transformamos en el marco lineal).
Meg
Sí, lo entiendo totalmente. Si bien también simpatizo con su impulso de hacerlo, si tuviera oído les advertiría contra la práctica de llamarlos modelos no lineales (al menos no sin calificar siempre el término), por las razones que describí anteriormente. Esa es una gran parte de por qué creo que esta es una pregunta tan importante: las personas a veces los llaman no lineales, lo que creo que está bien siempre que tengamos claro lo que llamamos no lineal, ya que no es la forma más convencional de consulte los modelos: cuando desafiamos la convención, debemos hacerlo con cuidado y deliberadamente.
Glen_b -Reinstate Monica