Me preguntaba si alguien podría ayudarme con información sobre Kurtosis (es decir, ¿hay alguna forma de transformar sus datos para reducirlos?)
Tengo un conjunto de datos de cuestionarios con una gran cantidad de casos y variables. Para algunas de mis variables, los datos muestran valores de curtosis bastante altos (es decir, una distribución leptokurtica) que se deriva del hecho de que muchos de los participantes dieron exactamente la misma puntuación para la variable. Tengo un tamaño de muestra particularmente grande, por lo que de acuerdo con el teorema del límite central, las violaciones de la normalidad aún deberían estar bien.
Sin embargo, el problema es el hecho de que los niveles particularmente altos de Kurtosis están produciendo una serie de valores atípicos univariantes en mi conjunto de datos. Como tal, incluso si transformo los datos, o elimino / ajusto los valores atípicos, los altos niveles de curtosis significan que los siguientes puntajes más extremos se convierten automáticamente en valores atípicos. Mi objetivo es usar (Análisis de función discriminante). Se dice que DFA es robusto a las desviaciones de la normalidad siempre que la violación sea causada por asimetría y no por valores atípicos. Además, también se dice que DFA está particularmente influenciado por valores atípicos en los datos (Tabachnick y Fidel).
¿Alguna idea de cómo solucionar esto? (Mi pensamiento inicial era alguna forma de controlar la curtosis, pero ¿no es algo bueno si la mayoría de mi muestra está dando calificaciones similares?)