Suponga que tengo una variable cuya distribución está sesgada positivamente en un grado muy alto, de modo que tomar el registro no será suficiente para colocarlo dentro del rango de asimetría para una distribución normal. ¿Cuáles son mis opciones en este momento? ¿Qué puedo hacer para transformar la variable en una distribución normal?
data-transformation
skewness
Histelheim
fuente
fuente
Respuestas:
Pruebe la transformación directa de Box-Cox según Box, GEP y Cox, DR (1964), "An Analysis of Transformations", Journal of the Royal Statistical Society, Serie B , 26, 211--234. SAS tiene la descripción de su función de verosimilitud en Normalizing Transformations , que puede usar para encontrar el parámetro óptimo , que se describe en Atkinson, AC (1985), Plots, Transformations, and Regression , Nueva York: Oxford University Press.λ
Es muy fácil implementarlo con la función LL, o si tiene un paquete de estadísticas como SAS o MATLAB use sus comandos: es el comando boxcox en MATLAB y PROC TRANSREG en SAS.
Además, en R esto está en el paquete MASS, función boxcox ().
fuente
Para el sesgo positivo (la cola está en el extremo positivo del eje x), existen la transformación de raíz cuadrada, la transformación logarítmica y la transformación inversa / recíproca (en orden de gravedad creciente). Por lo tanto, si la transformación del registro no es suficiente, puede usar el siguiente nivel de transformación. Box Cox ejecuta todas las transformaciones automáticamente para que pueda elegir la mejor.
fuente
La mayoría de las suites de software usarán el número de Euler como la base de registro predeterminada, AKA: registro natural. Puede usar un número base más alto para controlar los datos excesivamente sesgados a la derecha. La forma en que lo hace sintaxis depende del software que esté utilizando.
Si necesita salir de sus valores transformados una vez que se han realizado las estimaciones, podría ser un poco más fácil usar este método porque todo lo que tiene que hacer es realizar un operador exponencial en su variable con cualquier base de registro.
fuente