¿El uso de la transformación box-cox en conjuntos de datos individuales impide que estos datos sean comparables?

8

He estado usando la transformación box-cox para normalizar los datos para la entrada a un software de análisis de factor de nicho ecológico, según lo recomendado por los creadores del software.

Sin embargo, se me ocurrió que el método de transformación box-cox (¡obviamente!) Ha estado seleccionando diferentes valores lambda para cada transformación. Por ejemplo, quiero comparar la influencia de los factores A, B y C en la ubicación individual durante cuatro fechas de muestra. Cada factor ha sido separado por box-cox-ised (por separado tanto de otros factores como de otras fechas). ¿Significa esto que los resultados de cada análisis factorial no serán comparables (y que la simple comparación de los datos transformados, por ejemplo, por ANOVA, no será posible) debido a la selección de diferentes valores lambda para cada transformación?

JSnf2012
fuente
¿Podría aclarar qué quiere decir con "por separado tanto de otros factores como de otras fechas"? ¿Está diciendo que cada uno de A, B y C se ha transformado por separado, utilizando diferentes parámetros, o está diciendo que la transformación de (digamos) A ha variado por fecha? La distinción es crucial, porque la respuesta en el primer caso es que se puede hacer la comparación deseada mientras que en el segundo caso, las conclusiones se pueden dibujar son más limitadas.
whuber
Cada uno de A, B y C se ha transformado por separado utilizando un método box-cox. Dentro de cada factor, la transformación se realizó por separado para cada una de las cuatro fechas (es decir, 12 transformaciones en total). Espero que esto ayude. Además, gracias a Michael Chernick.
JSnf2012
1
Entonces Michael tiene razón (+1). La solución es regresar y transformar todos los valores A de la misma manera, todos los valores B, etc., y volver a hacer el análisis.
whuber

Respuestas:

4

Sí. Si están en escalas diferentes, lógicamente no puede compararlos. Si todas las transformaciones hubieran sido las mismas, la transformación de potencia es monotónica. Sin embargo, la variación de la muestra cambia debido a la transformación y eso debería tenerse en cuenta. Pero en tu situación no puedes compararlos.

Michael R. Chernick
fuente
Ah, esto confirma mis temores. Gracias por tu ayuda Michael y whuber!
JSnf2012
¡Probablemente sería mejor para ti encontrar una transformación de compromiso! y luego use la misma potencia de transformación boxcox para todos los conjuntos de datos.
kjetil b halvorsen