¿Error aditivo o error multiplicativo?

Soy relativamente nuevo en estadísticas y agradecería ayuda para entender esto mejor.

En mi campo hay un modelo de forma comúnmente utilizado:

{PAG}_{t} = {PAG}_{o} (V_{t})^{α}

$P_t = P_o(V_t)^\alpha$

Cuando las personas ajustan el modelo a los datos, generalmente lo linealizan y ajustan lo siguiente

Iniciar sesión ({PAG}_{t}) = Iniciar sesión ({PAG}_{o}) + α Iniciar sesión (V_{t}) + ϵ

$\log(P_t) = \log(P_o) + \alpha \log(V_t) + \epsilon$

¿Esta bien? Leí en alguna parte que debido al ruido en la señal, el modelo real debería ser

{PAG}_{t} = {PAG}_{o} (V_{t})^{α} + ϵ

$P_t = P_o(V_t)^\alpha + \epsilon$

y esto no se puede linealizar como anteriormente. ¿Es esto cierto? Si es así, ¿alguien sabe de alguna referencia que pueda leer y aprender más sobre ella y que probablemente cite en un informe?

modeling model error curve-fitting measurement-error ciaran_r
fuente

He formateado tus ecuaciones. Compruebe si el contenido sigue siendo lo que pretendía (especialmente con respecto a los subíndices).

Andy

Ha marcado su pregunta con "error de medición" y el + e en la 3a ecuación parece deberse a un error de medición aditivo además de la variación estocástica / aleatoria multiplicativa en la respuesta, algo así como P * (V ^ alpha) * exp (e). ¿Es esto correcto? Los modelos de error de medición (también conocidos como modelos de "error en variables") a menudo requieren una especie de proceso de dos pasos, que en su caso podría requerir datos de validación separados para caracterizar el error aditivo debido al "ruido", en cuyo caso podría no existir un necesita linealizar la ecuación.

N Brouwer

Respuestas:

El modelo apropiado depende de cómo la variación alrededor de la media entra en las observaciones. Bien puede venir en forma multiplicativa o aditiva ... o de alguna otra manera.

Incluso puede haber varias fuentes de esta variación, algunas de las cuales pueden ingresar de forma multiplicativa y otras que entran de manera aditiva y otras de una manera que tampoco puede caracterizarse realmente.

A veces hay una teoría clara para establecer cuál es la adecuada. A veces, reflexionar sobre las principales fuentes de variación sobre la media revelará una elección adecuada. Con frecuencia, las personas no tienen una idea clara de qué usar, o si varias fuentes de variación de diferentes tipos pueden ser necesarias para describir adecuadamente el proceso.

Con el modelo log-lineal, donde se usa la regresión lineal:

$\log(P_t)=log(P_o)+α\log(V_t)+ϵ$

el modelo de regresión OLS supone una variación constante de la escala logarítmica, y si ese es el caso, los datos originales mostrarán una extensión creciente sobre la media a medida que aumenta la media.

Por otro lado, este tipo de modelo:

$P_t=P_o(V_t)^α+ϵ$

generalmente se ajusta por mínimos cuadrados no lineales, y nuevamente, si se ajusta la varianza constante (el valor predeterminado para NLS), entonces la propagación sobre la media debe ser constante.

ingrese la descripción de la imagen aquí

[Puede tener la impresión visual de que la propagación está disminuyendo a medida que aumenta la media en la última imagen; eso es en realidad una ilusión causada por la pendiente creciente: tendemos a juzgar la extensión ortogonal a la curva en lugar de verticalmente para obtener una impresión distorsionada.]

Si tiene una propagación casi constante en la escala original o en la escala logarítmica, eso podría sugerir cuál de los dos modelos se ajusta, no porque demuestre que es aditivo o multiplicativo, sino porque conduce a una descripción adecuada de la propagación, así como a la media.

Por supuesto, uno también podría tener la posibilidad de un error aditivo que tuviera una varianza no constante.

Sin embargo, todavía hay otros modelos en los que se pueden ajustar tales relaciones funcionales que tienen diferentes relaciones entre la media y la varianza (como un GLM de Poisson o cuasi-Poisson, que se ha extendido proporcionalmente a la raíz cuadrada de la media).

Glen_b -Reinstate a Monica
fuente