¿Por qué no transformar con log todas las variables que no son de interés principal?

10

Los libros y las discusiones a menudo afirman que cuando se enfrentan a problemas (de los cuales hay algunos) con un predictor, la transformación logarítmica es una posibilidad. Ahora, entiendo que esto depende de las distribuciones y la normalidad en los predictores no es una suposición de regresión; pero la transformación de registros hace que los datos sean más uniformes, menos afectados por los valores atípicos, etc.

Pensé en el registro transformando todas mis variables continuas que no son de interés principal, es decir, variables que solo ajusto.

¿Es eso incorrecto? ¿Bueno? ¿Inútil?

Adam Robinsson
fuente

Respuestas:

24

Ahora, entiendo que esto depende de las distribuciones y la normalidad en los predictores

la transformación de registros hace que los datos sean más uniformes

Como afirmación general, esto es falso, pero incluso si fuera el caso, ¿por qué sería importante la uniformidad ?

Considere, por ejemplo,

i) un predictor binario que toma solo los valores 1 y 2. Tomar registros lo dejaría como un predictor binario que toma solo los valores 0 y log 2. Realmente no afecta nada excepto la intercepción y la escala de los términos que involucran a este predictor. Incluso el valor p del predictor no cambiaría, al igual que los valores ajustados.

ingrese la descripción de la imagen aquí

ii) considere un predictor de inclinación hacia la izquierda. Ahora toma troncos. Por lo general, se vuelve más sesgada a la izquierda.

ingrese la descripción de la imagen aquí

iii) los datos uniformes quedan sesgados

ingrese la descripción de la imagen aquí

(Sin embargo, a menudo no siempre es un cambio tan extremo)

menos afectado por los valores atípicos

Como afirmación general, esto es falso. Considere valores atípicos bajos en un predictor.

ingrese la descripción de la imagen aquí

Pensé en el registro transformando todas mis variables continuas que no son de interés principal

¿A que final? Si originalmente las relaciones fueran lineales, ya no lo serían.

ingrese la descripción de la imagen aquí

Y si ya estuvieran curvados, hacer esto automáticamente podría empeorarlos (más curvarlos), no mejorarlos.

-

Tomar registros de un predictor (ya sea de interés primario o no) a veces puede ser adecuado, pero no siempre es así.

Glen_b -Reinstate a Monica
fuente
2
Muchas gracias por esta espléndida respuesta. Creo que muchos de nosotros, al menos yo, necesitábamos verlo visualizado de esta manera. ¿Pero también está de acuerdo en que los datos sesgados a la derecha deberían estar sujetos a la transformación de registros? ¿Más que otros sesgos y formas?
Adam Robinsson
1
Generalmente no, no. En algunas condiciones muy específicas, tal vez.
Glen_b -Reinstate Monica
β^=0.50
(cont.) que poder decir, por ejemplo, para un aumento de una pulgada en el número de circunferencia de la circunferencia del tronco, la altura media del árbol aumenta a la mitad del pie. Lo último es más fácil de interpretar y más fácil de calcular en el campo sin una calculadora.
StatsStudent
10

En mi opinión, no tiene sentido realizar la transformación de registro (y cualquier transformación de datos , por el caso) solo por el hecho de hacerlo. Como se mencionó en las respuestas anteriores, dependiendo de los datos, algunas transformaciones serían inválidas o inútiles . Le recomiendo que lea el siguiente excelente material introductorio de la OMI sobre transformación de datos : http://fmwww.bc.edu/repec/bocode/t/transint.html . Tenga en cuenta que los ejemplos de código en este documento están escritos en lenguaje Stata , pero de lo contrario el documento es lo suficientemente genérico y, por lo tanto, útil para usuarios que no son Stata también.

En este artículo se pueden encontrar algunas técnicas y herramientas simples para tratar problemas comunes relacionados con los datos , como la falta de normalidad , valores atípicos y distribuciones de mezclas (tenga en cuenta que la estratificación como un enfoque para tratar la distribución de mezclas es muy probablemente la más simple) Un enfoque más general y complejo para esto es el análisis de mezclas , también conocido como modelos de mezclas finitas , cuya descripción está más allá del alcance de esta respuesta). Transformación de Box-Cox, mencionado brevemente en las dos referencias anteriores, es una transformación de datos bastante importante, especialmente para datos no normales (con algunas advertencias). Para obtener más detalles sobre la transformación de Box-Cox, consulte este artículo introductorio .

Aleksandr Blekh
fuente
2
Grandes referencias Aleksandr. Gracias por compartir ese esceptisismo tan necesario. Gracias.
Adam Robinsson
1
@ AdamRobinsson: ¡Un placer, Adam! Me alegra que te haya gustado mi respuesta.
Aleksandr Blekh
8

La transformación de registros NO SIEMPRE mejora las cosas. Obviamente, no se pueden transformar las variables de transformación logarítmica que alcanzan valores cero o negativos, e incluso las positivas que abarcan cero podrían salir con valores atípicos negativos si se transforman logarítmicamente.

No solo debe registrar todo rutinariamente, sino que es una buena práctica PENSAR acerca de la transformación de predictores positivos seleccionados (adecuadamente, a menudo un registro, pero tal vez algo más) antes de ajustar un modelo. Lo mismo ocurre con la variable de respuesta. El conocimiento de la materia también es importante. Alguna teoría de la física o la sociología o lo que sea podría conducir naturalmente a ciertas transformaciones. En general, si ve variables que están sesgadas positivamente, es allí donde un registro (o tal vez una raíz cuadrada o recíproca) podría ayudar.

Algunos textos de regresión parecen sugerir que hay que mirar las gráficas de diagnóstico antes de considerar cualquier transformación, pero no estoy de acuerdo. Creo que es mejor hacer el mejor trabajo posible al hacer estas elecciones antes de instalar cualquier modelo, para que tenga el mejor punto de partida posible; luego mire los diagnósticos para ver si necesita ajustar desde allí.

Russ Lenth
fuente
Todos agregan que estas consideraciones se aplican tanto a los predictores importantes como a los no importantes.
Russ Lenth
Gracias @rvl! Siempre estoy confundido por la discordancia entre cuándo y cómo elegir las transformaciones; los libros a menudo afirman que, como escribió, uno necesita verificar la forma de todas las variables antes de tocar la regresión. Gracias por brindarnos sus ideas.
Adam Robinsson
@rvl, gracias por tu respuesta. ¿Transformaría el snoqconjunto de datos en este hilo CrossValidated (teniendo en cuenta que el objetivo es adaptar una mezcla de gaussianos)?
Zhubarb
-3

1) contar datos (y> 0) -> log (y) o y = exp (b0 + biXi) 2) contar datos + cero (y> = 0) -> modelo de obstáculo (binomial + conteo reg.) 3) todos los efectos multiplicativos (y errores) serán aditivos 4) varianza ~ media -> log (y) o y = exp (b0 + biXi) 5) ...

Ivan Kshnyasev
fuente
Esta respuesta es difícil de leer y no está claro si intenta responder la pregunta.
Juho Kokkala
1
TEX