¿Cuál es el significado intuitivo de tener una relación lineal entre los registros de dos variables?

20

Tengo dos variables que no muestran mucha correlación cuando se grafican entre sí tal como están, pero una relación lineal muy clara cuando trazo los registros de cada variable contra la otra.

Así que terminaría con un modelo del tipo:

\log (Y) = a \log (X) + b

$\log(Y) = a \log(X) + b$ , que es excelente matemáticamente pero no parece tener el valor explicativo de un modelo lineal regular.

¿Cómo puedo interpretar tal modelo?

regression correlation log Los hijos de Akaike
fuente

55

No tengo nada sustancial que agregar a las respuestas existentes, pero un logaritmo en el resultado y el predictor es una elasticidad. Las búsquedas de ese término deberían encontrar algunos buenos recursos para interpretar esa relación, que no es muy intuitiva.

Upper_Case-Stop Harming Monica

La interpretación de un modelo log-log, donde la variable dependiente es log (y) y la variable independiente es log (x), es:

% Δ = β_{1} % Δ x

$\%Δ=β_1\%Δx$ .

Bob

3

El enlace log-log complementario es una especificación GLM ideal cuando el resultado es binario (modelo de riesgo) y la exposición es acumulativa, como el número de parejas sexuales frente a la infección por VIH. jstor.org/stable/2532454

Adamo

2

@Alexis puede ver los puntos adhesivos si superpone las curvas. Trate curve(exp(-exp(x)), from=-5, to=5)vs curve(plogis(x), from=-5, to=5). La concavidad se acelera. Si el riesgo de evento de un solo encuentro fue , entonces el riesgo después del segundo evento debería ser y así sucesivamente, esa es una forma probabilística que el logit no capturará. Las exposiciones altas y altas sesgarían los resultados de la regresión logística de manera más dramática (falsamente de acuerdo con la regla de probabilidad previa). Algunas simulaciones te mostrarían esto.

p

$p$

1 - (1 - p)^{2}

$1-(1-p)^2$

AdamO

1

@AdamO Probablemente haya un documento pedagógico para ser escrito que incorpore dicha simulación que motive cómo elegir un enlace de resultado dicotómico particular de los tres, incluidas las situaciones en las que hace y no hace la diferencia.

Alexis

27

Solo necesita tomar exponencial de ambos lados de la ecuación y obtendrá una relación potencial, que puede tener sentido para algunos datos.

\log (Y) = a \log (X) + b

$\log(Y) = a\log(X) + b$

\exp (\log (Y)) = \exp (a \log (X) + b)

$\exp(\log(Y)) = \exp(a \log(X) + b)$

Y = e^{b} \cdot X^{a}

$Y = e^b\cdot X^a$

Y dado que es solo un parámetro que puede tomar cualquier valor positivo, este modelo es equivalente a: $e^b$

Y = c \cdot X^{a}

$Y=c \cdot X^a$

Cabe señalar que la expresión del modelo debe incluir el término de error, y este cambio de variables tiene efectos interesantes sobre él:

\log (Y) = a \log (X) + b + ϵ

$\log(Y) = a \log(X) + b + \epsilon$

Y = e^{b} \cdot X^{a} \cdot \exp (ϵ)

$Y = e^b\cdot X^a\cdot \exp(\epsilon)$

Es decir, su modelo con errores aditivos que se ajustan a las condiciones de OLS (errores normalmente distribuidos con varianza constante) es equivalente a un modelo potencial con errores multiplicativos cuyo logaritmo sigue una distribución normal con varianza constante.

Pere
fuente

3

OP puede estar interesado en saber que esta distribución tiene un nombre, el log-normal: en.wikipedia.org/wiki/Log-normal_distribution

gardenhead

2

¿Qué pasa con el efecto de la desigualdad de Jensen? Generalmente para g convexo,

E [g (X)] \geq g (E [X])

$E[g(X)]≥g(E[X])$

Estadísticas

14

Puede tomar su $\log(Y)=a\log(X)+b$ modelo y calcular el diferencial total, terminará con algo como:

\frac{1}{Y} d Y = a \frac{1}{X} d X

$\frac{1}YdY=a\frac{1}XdX$ que rinde a

\frac{d Y}{d X} \frac{X}{Y} = a

$\frac{dY}{dX}\frac{X}{Y}=a$

Por lo tanto una interpretación sencilla del coeficiente de $a$ será el porcentaje de cambio en $Y$ para un porcentaje de cambio en $X$ . Esto implica además que la variable $Y$ crecimientos en una constante fracción ( $a$ ) de la tasa de crecimiento de $X$ .

RScrlli
fuente

Entonces, si el gráfico log-log es lineal, ¿eso implicaría una tasa de crecimiento constante?

Dimitriy V. Masterov

En realidad, no, la tasa de crecimiento de

será constante si y solo si

.

Y

$Y$

a = 0

$a=0$

RScrlli

No con el tiempo, la tasa de crecimiento con respecto al crecimiento en x.

Dimitriy V. Masterov

reordenar no ayuda, lo eliminaría

Aksakal

1

@ DimitriyV.Masterov Ok, a continuación, ya que el

es lineal en

significa que la variable

crece a una fracción constante de la tasa de crecimiento de

. ¿Hay algo mal con mi respuesta según usted?

\log (Y)

$\log(Y)$

\log (X)

$\log(X)$

Y

$Y$

X

$X$

RScrlli

7

Intuitivamente $\log$ nos da el orden de magnitud de una variable, por lo que podemos ver la relación como los órdenes de magnitud de las dos variables están linealmente relacionados. Por ejemplo, aumentar el predictor en un orden de magnitud puede estar asociado con un aumento de tres órdenes de magnitud de la respuesta.

Al trazar usando un diagrama de log-log , esperamos ver una relación lineal. Usando un ejemplo de esta pregunta , podemos verificar los supuestos del modelo lineal:

log-log

qwr
fuente

3

+1 para una respuesta intuitiva a un concepto no intuitivo. Sin embargo, la imagen que ha incluido viola claramente la variación constante de error en el predictor.

Frans Rodenburg

1

La respuesta es correcta, pero la atribución de autor es incorrecta. La imagen no debe atribuirse a las imágenes de Google, sino, al menos, a la página web donde se encuentra, que se puede encontrar simplemente haciendo clic en las imágenes de Google.

Pere

@Pere desafortunadamente no puedo encontrar la fuente original de la imagen (al menos usando la búsqueda de imagen inversa)

qwr

Parece provenir originalmente de diagramss.us aunque ese sitio está caído y la mayoría de sus páginas no están en el Archivo Web, aparte de su página de inicio

Henry

4

Conciliar la respuesta de @Rscrill con datos discretos reales, considere

\log (Y_{t}) = a \log (X_{t}) + b, \log (Y_{t - 1}) = a \log (X_{t - 1}) + b

$\log(Y_t) = a\log(X_t) + b,\;\;\; \log(Y_{t-1}) = a\log(X_{t-1}) + b$

⟹ \log (Y_{t}) - \log (Y_{t - 1}) = a [\log (X_{t}) - \log (X_{t - 1})]

$\implies \log(Y_t) - \log(Y_{t-1}) = a\left[\log(X_t)-\log(X_{t-1})\right]$

Pero

\log (Y_{t}) - \log (Y_{t - 1}) = \log (\frac{Y_{t}}{Y_{t - 1}}) \equiv \log (\frac{Y_{t - 1} + Δ Y_{t}}{Y_{t - 1}}) = \log (1 + \frac{Δ Y_{t}}{Y_{t - 1}})

$\log(Y_t) - \log(Y_{t-1}) = \log\left(\frac{Y_t}{Y_{t-1}}\right) \equiv \log\left(\frac{Y_{t-1}+\Delta Y_t}{Y_{t-1}}\right) = \log\left(1+\frac{\Delta Y_t}{Y_{t-1}}\right)$

$\frac{\Delta Y_t}{Y_{t-1}}$ $Y$ $t-1$ $t$ $Y_t$ $g_{Y_{t}}$ $0.1$

\log (1 + \frac{Δ Y_{t}}{Y_{t - 1}}) \approx \frac{Δ Y_{t}}{Y_{t - 1}} = g_{Y_{t}}

$\log\left(1+\frac{\Delta Y_t}{Y_{t-1}}\right) \approx \frac{\Delta Y_t}{Y_{t-1}}=g_{Y_{t}}$

Por lo tanto obtenemos

g_{Y_{t}} \approx a g_{X_{t}}

$g_{Y_{t}}\approx ag_{X_{t}}$

que valida en estudios empíricos el tratamiento teórico de @Rscrill.

Alecos Papadopoulos
fuente

1

Esto es probablemente lo que un matemático llamaría intuitivo :)

Richard Hardy

2

Y \sim X^{α}

$Y \sim X^\alpha$

X

$X$

X

$X$

Y

$Y$

X

$X$

Itamar
fuente

¿Cuál es el significado intuitivo de tener una relación lineal entre los registros de dos variables?

Respuestas: