Para algunas mediciones, los resultados de un análisis se presentan adecuadamente en la escala transformada. Sin embargo, en la mayoría de los casos, es deseable presentar los resultados en la escala de medición original (de lo contrario, su trabajo es más o menos inútil).
Por ejemplo, en el caso de datos transformados logarítmicamente, surge un problema con la interpretación en la escala original porque la media de los valores registrados no es el logaritmo de la media. Tomar el antilogaritmo de la estimación de la media en la escala logarítmica no da una estimación de la media en la escala original.
Sin embargo, si los datos transformados en el registro tienen distribuciones simétricas, se mantienen las siguientes relaciones (ya que el registro conserva el orden):
(el antilogaritmo de la media de los valores logarítmicos es la mediana en la escala original de mediciones).
Por lo tanto, solo puedo hacer inferencias sobre la diferencia (o la relación) de las medianas en la escala de medición original.
Las pruebas t de dos muestras y los intervalos de confianza son más confiables si las poblaciones son más o menos normales con aproximadamente desviaciones estándar, por lo que podemos sentir la tentación de usar la Box-Cox
transformación para que se asuma la suposición de normalidad (también creo que es una transformación estabilizadora de varianza )
Sin embargo, si aplicamos las herramientas t a los Box-Cox
datos transformados, obtendremos inferencias sobre la diferencia en los medios de los datos transformados. ¿Cómo podemos interpretar aquellos en la escala original de medición? (La media de los valores transformados no es la media transformada). En otras palabras, tomar la transformación inversa de la estimación de la media, en la escala transformada, no da una estimación de la media en la escala original.
¿Puedo hacer inferencias solo sobre las medianas en este caso? ¿Hay alguna transformación que me permita volver a los medios (en la escala original)?
Esta pregunta se publicó inicialmente como un comentario aquí.
fuente
Si la transformación de Box-Cox produce una distribución simétrica, entonces la media de los datos transformados se transforma de nuevo a la mediana en la escala original. Esto es cierto para cualquier transformación monotónica, incluidas las transformaciones de Box-Cox, las transformaciones de IHS, etc. Por lo tanto, las inferencias sobre las medias en los datos transformados corresponden a las inferencias sobre la mediana en la escala original.
Como los datos originales estaban sesgados (o no habrías usado una transformación de Box-Cox en primer lugar), ¿por qué quieres hacer inferencias sobre los medios? Pensé que trabajar con medianas tendría más sentido en esta situación. No entiendo por qué esto se ve como un "problema con la interpretación en la escala original".
fuente
Si desea hacer una inferencia sobre los medios en la escala original, podría considerar usar una inferencia que no use una suposición de normalidad.
Ten cuidado, sin embargo. Simplemente conectando una comparación directa de medias a través de un nuevo muestreo (ya sea pruebas de permutación o bootstrapping) cuando las dos muestras tienen variaciones diferentes puede ser un problema si su análisis asume que las variaciones son iguales (y las variaciones iguales en la escala transformada serán diferencias diferentes) en la escala original si las medias difieren). Tales técnicas no evitan la necesidad de pensar en lo que estás haciendo.
-
El caso más fácil es cuando tiene normalidad en la escala logarítmica y, por lo tanto, es lognormal en la escala original. Si se conoce su varianza (lo que ocurre muy raramente en el mejor de los casos), puede construir CI y PI lognormales en la escala original, y puede dar una media pronosticada a partir de la media de la distribución de la cantidad relevante.
Debe pensar con mucho cuidado exactamente qué pregunta está tratando de responder.
fuente