Estoy usando la 1/4
transformación de poder de la cuarta raíz ( ) en mi variable de respuesta, como resultado de la heterocedasticidad. Pero ahora no estoy seguro de cómo interpretar mis coeficientes de regresión.
Supongo que necesitaría llevar los coeficientes a la cuarta potencia cuando realice una transformación inversa (vea la salida de regresión a continuación). Todas las variables están en unidades de dólares en millones, pero me gustaría saber el cambio en dólares en miles de millones.
Mientras se mantiene constante la otra variable independiente, un cambio de honorarios de mil millones de dólares, en promedio, conduce a un cambio de 32
(o 32,000 dólares) en las colecciones. Tomo 0.000075223 * 1000
(para llegar a miles de millones) ^ 4 = 0.000032
. ¿Ahora multiplico este número por 1 millón o 1 billón (la unidad original de la variable dependiente está en millones)?
lm(formula = (Collections^(1/4)) ~ Fees + DIR)
Estimate Std. Error t value Pr(>|t|)
(Intercept) 2.094573355 0.112292375 18.653 0.0000000000000151
Fees **0.000075223 **0.000008411 8.943 0.0000000131878713
DIR 0.000022279 0.000004107 5.425 0.0000221138881913
fuente
Respuestas:
La mejor solución es, desde el principio, elegir una nueva expresión que tenga un significado en el campo de estudio.
(Por ejemplo, cuando la regresión de los pesos corporales contra factores independientes, es probable que sea una raíz cúbica ( de potencia) o de la raíz cuadrada ( 1 / 2 se indicarán potencia). Tomando nota de que el peso es un buen indicador de volumen, el cubo raíz es una longitud que representa un tamaño lineal característica esto dota de un significado intuitivo, potencialmente interpretable Aunque la propia raíz cuadrada no tiene tal interpretación clara, que está cerca de la.. 2 / 3 de potencia, que tiene unas dimensiones de área de la superficie : se podría corresponder al área total de la piel).1/3 1/2 2/3
El cuarto poder está lo suficientemente cerca del logaritmo que debería considerar usar el registro , cuyos significados se entienden bien. Pero a veces realmente encontramos que una raíz cúbica o raíz cuadrada o alguna potencia fraccional de este tipo hace un gran trabajo y no tiene una interpretación obvia. Entonces, debemos hacer un poco de aritmética.
El modelo de regresión que se muestra en la pregunta involucra una variable dependiente ("Colecciones") y dos variables independientes X 1 ("Tasas") y X 2 ("DIR"). Plantea queY X1 X2
El código estima como b 0 = 2.094573355 , β 1 como b 1 = 0.000075223 y β 2 como b 2 = 0.000022279 . También supone que ε son normales con media cero y estima su varianza común (no se muestra). Con estas estimaciones, el valor ajustado de Y 1 / 4 esβ0 b0=2.094573355 β1 b1=0.000075223 β2 b2=0.000022279 ε Y1/4
"Interpretar" los coeficientes de regresión normalmente significa determinar qué cambio en la variable dependiente es sugerido por un cambio dado en cada variable independiente. Estos cambios son las derivadas , que la regla de la cadena nos dice que son iguales a 4 β i Y 3 . Enchufaríamos las estimaciones, entonces, y diríamos algo comodY/dXi 4βiY3
La dependencia de la interpretación de y X 2 no se expresa simplemente en palabras, aX1 X2 diferencia de las situaciones sin transformación de (un cambio de unidad en X i está asociado con un cambio de b i en Y ) o con el logaritmo (uno el cambio porcentual en X i está asociado con el cambio porcentual b i en Y ). Sin embargo, al mantener la primera forma de la interpretación y calcular 4 b 1 = 4 × 0.000075223 = 0.000301Y Xi bi Y Xi bi Y 4b1 4×0.000075223 0.000301 , podríamos decir algo como
Cuando tome raíces distintas de la cuarta, por ejemplo, cuando use como respuesta en lugar de Y en sí, con p distinto de cero, simplemente reemplace todas las apariencias de " 4 " en este análisis por " 1 / p ".Yp Y p 4 1/p
fuente
Una alternativa a la transformación aquí es usar un modelo lineal generalizado con función de enlace potencia y potencia 1/4. Qué familia de error usar está abierta, lo que le brinda más flexibilidad que la que tiene con la regresión lineal y una suposición de normalidad condicional. Una ventaja importante de este procedimiento es que las predicciones se producen automáticamente en la escala de medición original, por lo que no se trata de una transformación inversa.
fuente
He visto artículos que usan coeficientes de regresión de raíz cuártica al pensar en cambios porcentuales, evitando tomar registros (y descartar observaciones).
Si estamos interesados en usar raíces cuárticas para calcular los cambios porcentuales, sabemos que:
For the equivalent of a log-level regression, in which we're interested in the percentage change inY resulting from a unit change in X , we have to know the levels of all the X variables:
For the equivalent of a log-log regression, in which we're interested in the percentage inY resulting from a percentage change in X , we'd have:
It doesn't seem especially convenient (I prefer the log transformation), but it can be done, either evaluating theX values at the sample means or at hypothetical values.
I suppose, actually, you could replace the denominator with the sample average value ofY1/4 , and that would be a bit more convenient.
fuente