¿Cuál es la importancia de la distinción entre modelos lineales y no lineales? La pregunta Modelo lineal no lineal versus generalizado: ¿Cómo se refiere a la regresión logística, de Poisson, etc.? y su respuesta fue una aclaración extremadamente útil de la linealidad / no linealidad de los modelos lineales generalizados. Parece críticamente importante distinguir los modelos lineales de los no lineales, pero no me queda claro por qué. Por ejemplo, considere estos modelos de regresión:
Ambos modelos 1 y 2 son lineales, y las soluciones a existen en forma cerrada, que se encuentran fácilmente utilizando un estimador estándar de MCO. No es así para los modelos 3 y 4, que no son lineales porque (algunos de) los derivados de E [ Y ∣ X ] wrt β siguen siendo funciones de β .
Una solución simple para estimar en el Modelo 3 es linealizar el modelo estableciendo γ = β 2 1 , estimar γ utilizando un modelo lineal y luego calcular β 1 = √ .
Para estimar los parámetros en el Modelo 4, podemos suponer que sigue una distribución binomial (miembro de la familia exponencial) y, utilizando el hecho de que la forma logística del modelo es el enlace canónico, linealiza las rhs del modelo. Esta fue la contribución fundamental de Nelder y Wedderburn .
Pero, ¿por qué esta no linealidad es un problema en primer lugar? ¿Por qué no se puede simplemente usar un algoritmo iterativo para resolver el Modelo 3 sin linealizar con la función de raíz cuadrada, o el Modelo 4 sin invocar GLM? Sospecho que antes del poder computacional generalizado, los estadísticos intentaban linealizar todo. Si es cierto, ¿entonces quizás los "problemas" introducidos por la no linealidad son un remanente del pasado? ¿Las complicaciones introducidas por los modelos no lineales son meramente computacionales, o existen otros problemas teóricos que hacen que los modelos no lineales sean más difíciles de ajustar a los datos que los modelos lineales?
fuente
Respuestas:
Puedo ver dos diferencias principales:
La linealidad lo hace simple y robusto. Por ejemplo, el OLS (lineal) es un estimador imparcial bajo una distribución de perturbación desconocida. En general, GLM y modelos no lineales no lo son. OLS también es robusto para varios modelos de estructura de error (efectos aleatorios, agrupamiento, etc.) donde, en modelos no lineales, normalmente debe asumir la distribución exacta de estos términos.
Resolverlo es fácil: solo un par de multiplicaciones matriciales + 1 inversa. Esto significa que casi siempre puede resolverlo, incluso en casos donde la función objetivo es casi plana (multicolinealidad). Los métodos iterativos pueden no converger en casos tan problemáticos (que, en cierto sentido, es algo bueno). La solución fácil puede o puede No será menos un problema hoy en día. Las computadoras se vuelven más rápidas, pero los datos se hacen más grandes. ¿Alguna vez intentó ejecutar una regresión logit en observaciones 1G?
Además de eso, los modelos lineales son más fáciles de interpretar. En los modelos lineales, los efectos marginales son iguales a los coeficientes y son independientes de los valores de X (aunque los términos polinómicos arruinan esta simplicidad).
fuente
Muchos modelos en biología (y otros campos) son no lineales, por lo que se ajustan mejor con la regresión no lineal. Las matemáticas son muy diferentes, por supuesto. Pero desde el punto de vista del analista de datos, realmente solo hay una diferencia importante.
La regresión no lineal requiere valores estimados iniciales para cada parámetro. Si estas estimaciones iniciales están muy lejos, el programa de regresión no lineal puede converger en un mínimo falso y dar resultados inútiles o engañosos.
fuente
En primer lugar, voy a sustituir la palabra 'modelo' por la palabra 'regresión'. Creo que para ambas palabras uno realmente pregunta cuáles son las ecuaciones relevantes que definen el modelo y cuáles son las hipótesis relevantes que relacionan los valores de la variable dependiente y los valores predichos por la ecuación / modelo. Creo que el término "modelo" es más estándar. Si estás de acuerdo con eso, sigue leyendo.
fuente