Un modelo exponencial es un modelo descrito por la siguiente ecuación:
El enfoque más común utilizado para estimar dicho modelo es la linealización, que se puede hacer fácilmente calculando logaritmos de ambos lados. ¿Cuáles son los otros enfoques? Estoy especialmente interesado en aquellos que pueden manejar en algunas observaciones.
Actualización 31.01.2011
Soy consciente del hecho de que este modelo no puede producir cero. Explicaré un poco lo que estoy modelando y por qué elijo este modelo. Digamos que queremos predecir cuánto dinero gasta un cliente en una tienda. Por supuesto, muchos clientes solo buscan y no compran nada, por eso hay 0. No quería usar el modelo lineal porque produce muchos valores negativos, lo que no tiene ningún sentido. La otra razón es que este modelo funciona realmente bien, mucho mejor que el lineal. He usado algoritmos genéticos para estimar esos parámetros, por lo que no fue un enfoque 'científico'. Ahora me gustaría saber cómo lidiar con los problemas utilizando métodos más científicos. También se puede suponer que la mayoría, o incluso todas, las variables son variables binarias.
fuente
Respuestas:
Hay varios problemas aqui.
(1) El modelo debe ser explícitamente probabilístico . En casi todos los casos, no habrá un conjunto de parámetros para los cuales el lhs coincida con el rhs para todos sus datos: habrá residuales. Debe hacer suposiciones sobre esos residuos. ¿Esperas que sean cero en promedio? ¿Para ser distribuido simétricamente? ¿Estar aproximadamente distribuido normalmente?
Aquí hay dos modelos que están de acuerdo con el especificado pero que permiten un comportamiento residual drásticamente diferente (y, por lo tanto, generalmente darán lugar a estimaciones de parámetros diferentes). Puede variar estos modelos variando los supuestos sobre la distribución conjunta de :ϵyo
B: y i = β 0 exp ( β 1 x 1 i + … + β k x k i ) + ϵ i .
(Tenga en cuenta que estos son modelos para la información ; por lo general no hay tal cosa como un estimado valor de datos ).^ y yoyyo yyo^
(2) La necesidad de manejar valores cero para las y implica que el modelo (A) indicado es incorrecto e inadecuado , porque no puede producir un valor cero sin importar el error aleatorio. El segundo modelo anterior (B) permite valores cero (o incluso negativos) de y. Sin embargo, uno no debería elegir un modelo únicamente sobre esa base. Para reiterar # 1: es importante modelar los errores razonablemente bien.
(3) La linealización cambia el modelo . Por lo general, da como resultado modelos como (A) pero no como (B). Es utilizado por personas que han analizado sus datos lo suficiente como para saber que este cambio no afectará apreciablemente las estimaciones de los parámetros y por personas que ignoran lo que está sucediendo. (Es difícil, muchas veces, notar la diferencia).
(4) Una forma común de manejar la posibilidad de un valor cero es proponer que (o alguna reexpresión del mismo, como la raíz cuadrada) tiene una probabilidad estrictamente positiva de igual a cero. Matemáticamente, estamos mezclando una masa puntual (una "función delta") con alguna otra distribución. Estos modelos se ven así:y
donde es uno de los parámetros implícitos en el vector , es una familia de distribuciones parametrizadas por , es la reexpresión de las 's (la función "enlace" de un modelo lineal generalizado: ver la respuesta de onestop). (Por supuesto, entonces, = cuando ) Ejemplos son los Modelos de Poisson y binomio negativo inflados a cero .θ F θ 1 , … , θ jPrFθ[ f( Y) = 0 ] = θj + 1> 0 θ F θ1, ... , θj F y PrFθ[ f( Y) ≤ t ] ( 1 - θj + 1) Fθ( t ) t ≠ 0
(5) Los problemas de construir un modelo y ajustarlo están relacionados pero son diferentes . Como un ejemplo simple, incluso un modelo de regresión ordinario puede ajustarse de muchas maneras por medio de mínimos cuadrados (que proporciona las mismas estimaciones de parámetros que Máxima verosimilitud y casi los mismos errores estándar), mínimos cuadrados repesados de forma iterativa , varias otras formas de " mínimos cuadrados robustos " , etc. La elección del ajuste a menudo se basa en la conveniencia, la conveniencia ( por ejemplo , disponibilidad de software), la familiaridad, el hábito o la convención, pero al menos se debe pensar dado a lo que es apropiado para la distribución supuesta de los términos de error , a lo queϵ iY= β0 0+ β1X+ ϵ ϵyo la función de pérdida para el problema podría ser razonable, y ante la posibilidad de explotar información adicional (como una distribución previa de los parámetros).
fuente
Este es un modelo lineal generalizado (GLM) con una función de enlace de registro .
Cualquier distribución de probabilidad en con densidad distinta de cero en cero manejará en algunas observaciones; la más común sería la distribución de Poisson, que da como resultado una regresión de Poisson , también conocida como modelado log-lineal. Otra opción sería una distribución binomial negativa .[ 0 , ∞ ) yyo= 0
Si no tiene datos de recuento, o si toma valores no enteros, aún puede usar el marco de modelos lineales generalizados sin especificar completamente una distribución para pero en su lugar solo especificando la relación entre su media y varianza usando cuasi-verosimilitud . P ( y i | x )yyo PAG( yyoEl | x )
fuente
Siempre puedes usar mínimos cuadrados no lineales . Entonces tu modelo será:
Los ceros en serán tratados como desviaciones de la tendencia no lineal.yyo
fuente