¿Cómo interpretar los coeficientes de regresión cuando la respuesta fue transformada por la 4ta raíz?

20

Estoy usando la 1/4transformación de poder de la cuarta raíz ( ) en mi variable de respuesta, como resultado de la heterocedasticidad. Pero ahora no estoy seguro de cómo interpretar mis coeficientes de regresión.

Supongo que necesitaría llevar los coeficientes a la cuarta potencia cuando realice una transformación inversa (vea la salida de regresión a continuación). Todas las variables están en unidades de dólares en millones, pero me gustaría saber el cambio en dólares en miles de millones.

Mientras se mantiene constante la otra variable independiente, un cambio de honorarios de mil millones de dólares, en promedio, conduce a un cambio de 32(o 32,000 dólares) en las colecciones. Tomo 0.000075223 * 1000(para llegar a miles de millones) ^ 4 = 0.000032. ¿Ahora multiplico este número por 1 millón o 1 billón (la unidad original de la variable dependiente está en millones)?

lm(formula = (Collections^(1/4)) ~ Fees + DIR)

                 Estimate      Std. Error  t value            Pr(>|t|)
(Intercept)   2.094573355     0.112292375   18.653  0.0000000000000151
Fees        **0.000075223   **0.000008411    8.943  0.0000000131878713
DIR           0.000022279     0.000004107    5.425  0.0000221138881913
usuario13968
fuente
44
Es posible que desee leer esto: coeficientes de regresión de transformación de regresión .
gung - Restablecer Monica

Respuestas:

24

La mejor solución es, desde el principio, elegir una nueva expresión que tenga un significado en el campo de estudio.

(Por ejemplo, cuando la regresión de los pesos corporales contra factores independientes, es probable que sea una raíz cúbica ( de potencia) o de la raíz cuadrada ( 1 / 2 se indicarán potencia). Tomando nota de que el peso es un buen indicador de volumen, el cubo raíz es una longitud que representa un tamaño lineal característica esto dota de un significado intuitivo, potencialmente interpretable Aunque la propia raíz cuadrada no tiene tal interpretación clara, que está cerca de la.. 2 / 3 de potencia, que tiene unas dimensiones de área de la superficie : se podría corresponder al área total de la piel).1/31/22/3

El cuarto poder está lo suficientemente cerca del logaritmo que debería considerar usar el registro , cuyos significados se entienden bien. Pero a veces realmente encontramos que una raíz cúbica o raíz cuadrada o alguna potencia fraccional de este tipo hace un gran trabajo y no tiene una interpretación obvia. Entonces, debemos hacer un poco de aritmética.

El modelo de regresión que se muestra en la pregunta involucra una variable dependiente ("Colecciones") y dos variables independientes X 1 ("Tasas") y X 2 ("DIR"). Plantea queYX1X2

Y1/4=β0+β1X1+β2X2+ε.

El código estima como b 0 = 2.094573355 , β 1 como b 1 = 0.000075223 y β 2 como b 2 = 0.000022279 . También supone que ε son normales con media cero y estima su varianza común (no se muestra). Con estas estimaciones, el valor ajustado de Y 1 / 4 esβ0b0=2.094573355β1b1=0.000075223β2b2=0.000022279εY1/4

Y1/4^=b0+b1X1+b2X2.

"Interpretar" los coeficientes de regresión normalmente significa determinar qué cambio en la variable dependiente es sugerido por un cambio dado en cada variable independiente. Estos cambios son las derivadas , que la regla de la cadena nos dice que son iguales a 4 β i Y 3 . Enchufaríamos las estimaciones, entonces, y diríamos algo comodY/dXi4βiY3

Las estimaciones de regresión que un cambio unitario en estará asociada con un cambio en Y de 4 b i Y 3 = 4 b i ( b 0 + b 1 X 1 + b 2 X 2 ) 3 .XiY4biY^34bi(b0+b1X1+b2X2)3

La dependencia de la interpretación de y X 2 no se expresa simplemente en palabras, aX1X2 diferencia de las situaciones sin transformación de (un cambio de unidad en X i está asociado con un cambio de b i en Y ) o con el logaritmo (uno el cambio porcentual en X i está asociado con el cambio porcentual b i en Y ). Sin embargo, al mantener la primera forma de la interpretación y calcular 4 b 1 = 4 × 0.000075223 = 0.000301YXibiYXibiY4b14×0.0000752230.000301, podríamos decir algo como

Un cambio unitario en las tarifas está asociado con un cambio en las colecciones de veces el cubo de las colecciones actuales; por ejemplo, si las colecciones actuales son 10 , entonces un aumento unitario en las tarifas está asociado con un aumento de 0.301 en las colecciones y si las colecciones actuales son 20 , entonces el mismo aumento unitario en las tarifas está asociado con un aumento de 2.41 en las colecciones.0.000301100.301202.41


Cuando tome raíces distintas de la cuarta, por ejemplo, cuando use como respuesta en lugar de Y en sí, con p distinto de cero, simplemente reemplace todas las apariencias de " 4 " en este análisis por " 1 / p ". YpYp41/p

whuber
fuente
12

Una alternativa a la transformación aquí es usar un modelo lineal generalizado con función de enlace potencia y potencia 1/4. Qué familia de error usar está abierta, lo que le brinda más flexibilidad que la que tiene con la regresión lineal y una suposición de normalidad condicional. Una ventaja importante de este procedimiento es que las predicciones se producen automáticamente en la escala de medición original, por lo que no se trata de una transformación inversa.

Nick Cox
fuente
4

He visto artículos que usan coeficientes de regresión de raíz cuártica al pensar en cambios porcentuales, evitando tomar registros (y descartar observaciones).

Si estamos interesados ​​en usar raíces cuárticas para calcular los cambios porcentuales, sabemos que:

Y^=(α+β^1X1+β^2X2)4dY^dX1=4β^1(α+β^1X1+β^2X2)3

For the equivalent of a log-level regression, in which we're interested in the percentage change in Y resulting from a unit change in X, we have to know the levels of all the X variables:

dY^/dX1Y=4β^1α+β^1X1+β^2X2

For the equivalent of a log-log regression, in which we're interested in the percentage in Y resulting from a percentage change in X, we'd have:

dY^dX1X1Y^=4β^1X1α+β^1X1+β^2X2

It doesn't seem especially convenient (I prefer the log transformation), but it can be done, either evaluating the X values at the sample means or at hypothetical values.

I suppose, actually, you could replace the denominator with the sample average value of Y1/4, and that would be a bit more convenient.

user68005
fuente