¿Es una transformación logarítmica una técnica válida para probar t datos no normales?

19

En la revisión de un artículo, los autores afirman: "Las variables de resultado continuo que exhiben una distribución sesgada se transformaron, utilizando los logaritmos naturales, antes de que se realizaran pruebas t para satisfacer los supuestos de prerrequisitos de normalidad".

¿Es esta una forma aceptable de analizar datos no normales, particularmente si la distribución subyacente no es necesariamente lognormal?

Esta puede ser una pregunta muy estúpida, pero no he visto esto antes ...

CLS
fuente
3
Bueno, si la distribución inicial no es logarítmica normal, entonces los datos transformados no satisfacen los supuestos de prerrequisitos de normalidad, entonces, ¿qué se gana con la transformación?
Macro
@Macro - ¡lo suficientemente cierto! (+1): probablemente solo querían acercar las distribuciones a simétricas, lo que no es algo malo que desear hacer para la prueba t, pero, a menos que lo verificaran y escribieran, no sabemos si el registro transform indujo un sesgo negativo que podría haber empeorado las cosas ...
jbowman 03 de
2
Podríamos inferir que debido a que se hizo para satisfacer la normalidad, y la normalidad se verificó en primer lugar, esa normalidad se verificó después. Está fuertemente implícito en el lenguaje aquí.
Juan
10
Una prueba t para los logaritmos no es lo mismo que una prueba t para los datos no transformados ni una prueba no paramétrica. La prueba t en los registros compara las medias geométricas , no las medias aritméticas (habituales). Esta es una de varias consideraciones importantes para decidir si el uso de los logaritmos es aceptable (lo que puede ser, dependiendo de la aplicación).
whuber

Respuestas:

9

Es común tratar de aplicar algún tipo de transformación a la normalidad (usando, por ejemplo, logaritmos, raíces cuadradas, ...) cuando se encuentra con datos que no son normales. Si bien el logaritmo produce buenos resultados para datos asimétricos con bastante frecuencia, no hay garantía de que funcione en este caso particular. También se debe tener en cuenta el comentario de @whubers anterior al analizar los datos transformados: "Una prueba t para los logaritmos no es lo mismo que una prueba t para los datos no transformados ni una prueba no paramétrica. La prueba t en los registros compara geométrica significa, no los medios aritméticos (habituales) ".

norte-1yo=1norte(Xyo-X¯)3(norte-1yo=1norte(Xyo-X¯)2)3/ /2 es una estadística de prueba adecuado en este caso.

En lugar de elegir una transformación (como logaritmos) porque funciona la mayor parte del tiempo, prefiero usar el procedimiento Box-Cox para elegir una transformación utilizando los datos dados. Sin embargo, hay algunos problemas filosóficos con esto; en particular si esto debería afectar el número de grados de libertad en la prueba t, ya que hemos utilizado cierta información de la muestra al elegir qué transformación usar.

Finalmente, una buena alternativa para usar la prueba t después de una transformación o una prueba no paramétrica clásica es usar análogo de arranque de la prueba t. No requiere la suposición de normalidad y es una prueba sobre los medios no transformados (y no sobre cualquier otra cosa).

MånsT
fuente
1
+1 Buena discusión reflexiva con una buena recomendación al final. Para obtener más información sobre la versión bootstrap / resampling / permutation de la prueba t, consulte un hilo reciente en stats.stackexchange.com/q/24911 .
whuber
0

En términos generales, si no se cumplen los supuestos necesarios para llevar a cabo una prueba t, entonces sería más apropiado usar una prueba no paramétrica.

usuario7045
fuente
55
Tal vez. Las pruebas no paramétricas casi siempre comparan medianas (u otros percentiles) en lugar de medias y, por lo tanto, realmente abordan una pregunta ligeramente diferente. Pero esto no parece una respuesta útil a la pregunta actual, que pregunta específicamente (y solo) sobre la prueba t de los registros de los datos.
whuber