Ambas respuestas en estos hilos, una y dos afirman que debería transformarse antes de aplicar cualquier otra transformación a los predictores. De hecho, el capítulo de Weisberg sobre transformaciones se enfoca más en DV que en predictores, y también lo hace la página del manual powerTransform () del paquete de automóviles R.
Sin embargo, sabemos que la normalidad de la distribución DV no es un requisito en OLS para estimar los coeficientes AZUL e, incluso cuando los residuos no están estrictamente distribuidos normalmente, OLS sigue siendo un estimador razonable .
Entonces, ¿por qué el énfasis en transformar ? Hay un par de razones por las que creo que es preferible no transformar : primero, hace que la relación IV sea más difícil de leer y segundo, en predicción, requiere una transformación inversa del valor estimado a la escala original . Dependiendo de lo que estés haciendo, esto puede ser un problema.
fuente
Respuestas:
La transformación de X no afecta la forma de la distribución condicional, ni la heterocedasticidad, por lo que la transformación de X solo sirve para tratar las relaciones no lineales. (Si está ajustando modelos aditivos, puede servir para ayudar a eliminar la interacción, pero incluso eso es mejor dejar que se transforme Y)
Un ejemplo donde transformar solo X tiene sentido:
Si eso es, la falta de ajuste en la media condicional, es su problema principal, entonces la transformación de X puede tener sentido, pero si está transformando debido a la forma de la Y condicional o debido a la heterocedasticidad, si está resolviendo eso mediante transformación ( no necesariamente es la mejor opción, pero estamos tomando la transformación como algo dado para esta pregunta), entonces debe transformar Y de alguna manera para cambiarla.
Considere, por ejemplo, un modelo donde la varianza condicional es proporcional a la media:
Un ejemplo donde transformar solo X no puede resolver los problemas:
Mover valores en el eje x no cambiará el hecho de que la dispersión es mayor para los valores de la derecha que los valores de la izquierda. Si desea corregir esta variación cambiante por transformación, debe reducir los valores Y altos y estirar los valores Y bajos.
Ahora, si está considerando transformar Y, eso cambiará la forma de la relación entre la respuesta y los predictores ... por lo que a menudo esperará transformar X también si desea un modelo lineal (si era lineal antes de la transformación, No será después). A veces (como en el segundo gráfico anterior), una transformación Y = hará que la relación sea más lineal al mismo tiempo, pero no siempre es así.
Si está transformando tanto X como Y, primero desea hacer Y, debido a ese cambio en la forma de la relación entre Y y X, generalmente necesita ver cómo son las relaciones después de la transformación. La posterior transformación de X tendrá como objetivo obtener la linealidad de la relación.
Entonces, en general, si estás transformando algo, a menudo necesitas transformar Y, y si lo estás haciendo, casi siempre quieres hacerlo primero.
fuente
Transformar Y inicialmente es un enfoque anacrónico para el análisis de datos. Nuestros tatarabuelos hicieron eso, ¿por qué no deberíamos? Muchas razones y su publicación reflejan que las suposiciones gaussianas se basan únicamente en los errores de un modelo, NO la serie Y es acertada.
fuente