Mi colega quiere analizar algunos datos después de transformar la variable de respuesta elevándola a la potencia de (es decir, ). y0.125
Me siento incómodo con esto, pero me cuesta articular por qué. No se me ocurre ninguna razón mecanicista para esta transformación. Tampoco lo he visto antes, y me preocupa que tal vez infle las tasas de error Tipo I o algo así, ¡pero no tengo nada que respalde estas preocupaciones!
Además, mi colega encuentra que estos modelos transformados superan a los modelos no transformados en una comparación AIC. ¿Esto, en sí mismo, justifica su uso?
regression
data-transformation
aic
AndrewMacDonald
fuente
fuente
Respuestas:
Es una práctica común aplicar transformaciones de potencia (Tukey, Box-Cox) con valores arbitrarios en la respuesta. Desde esa perspectiva, no veo ninguna preocupación particular con respecto a su valor de 1/8: si esa transformación le da buenos residuos, hágalo.
Por supuesto, cualquier transformación cambia la relación funcional que se ajusta, y puede ser que 1/8 no tenga sentido mecanicista, pero eso no sería una preocupación para mí cuando el propósito no es extrapolar o ajustar parámetros de un físico ley, pero para obtener un valor p apropiado en el signo del efecto (diría que ese es el caso de uso normal en una regresión). Para ese propósito, su única preocupación es que la función se ajuste a los datos en el dominio de sus valores predictores (wrt media y variación residual), y eso es fácil de verificar.
Si no está seguro del mejor valor para la transformación de potencia y desea comparar entre diferentes opciones, no debe comparar directamente los valores de probabilidad / AIC porque la transformación de potencia cambia la escala de la respuesta. Afortunadamente, resulta que es relativamente sencillo calcular una corrección para la transformación, de modo que las diferentes transformaciones se puedan comparar a través de su probabilidad (corregida) (ver, por ejemplo, aquí ).
En R, esto se implementa en MASS :: boxcox: esta es una forma conveniente de elegir el valor correcto para la potencia.
fuente