La prueba de Kolgomorov-Smirnov, la prueba de Shapiro, etc. rechazan la hipótesis de que una distribución es normal. Sin embargo, cuando trazo los cuantiles y el histograma normales, los datos son claramente normales. ¿Quizás porque el poder de las pruebas es alto?
El tamaño de la muestra es de alrededor de 650. Entonces, ¿no debería al menos una de estas pruebas dejar de rechazar la hipótesis nula?
Resultados:
Kolmogorov-Smirnov D 0.05031 Pr > D <0.010
Cramer-von Mises W-Sq 0.30003 Pr > W-Sq <0.005
Anderson-Darling A-Sq 1.66965 Pr > A-Sq <0.005
Chi-Square Chi-Sq 3250.43596 18 Pr > Chi-Sq <0.001
normal-distribution
Robbie
fuente
fuente
Respuestas:
Las pruebas de normalidad son una pérdida de tiempo y su ejemplo ilustra por qué. Con muestras pequeñas, la prueba de normalidad tiene poca potencia, por lo que las decisiones sobre qué modelos estadísticos usar deben basarse en el conocimiento a priori . En estos casos, el hecho de no rechazar el nulo no prueba que el nulo sea incluso aproximadamente cierto en el nivel de la población.
Cuando tienes muestras grandes, las pruebas de normalidad se vuelven ridículamente poderosas, pero no te dicen nada que no supieras. Ninguna cantidad real se distribuye exactamente de manera normal. La distribución normal es solo una abstracción matemática que es una aproximación suficientemente buena en muchos casos. La prueba más simple de esto es que no hay una cantidad real (al menos ninguna que se me ocurra) que pueda tomar cualquier número real como su valor. Por ejemplo, solo hay tantas moléculas en el universo. Solo hay tantos dólares en la oferta monetaria. La velocidad de la luz es finita. Las computadoras solo pueden almacenar números de un tamaño finito, por lo que incluso si algo tuviera soporte para todos los números reales, no sería capaz de medirlo.
El punto es que ya sabía que sus datos no se distribuían exactamente de manera normal, pero las pruebas de normalidad no le dicen nada acerca de cuán no normales son los datos. No le dan absolutamente ninguna pista sobre si sus datos se distribuyen aproximadamente de manera normal, de modo que los métodos de inferencia estadística que supongan normalidad darían respuestas correctas. Irónicamente, las pruebas comunes (por ejemplo, la prueba T y ANOVA) que suponen normalidad son más robustas que la no normalidad en muestras de gran tamaño.
fuente
Esto no me sorprende --- con un tamaño de muestra lo suficientemente grande, cualquier buena prueba debería rechazar la hipótesis nula, a menos que la distribución de generación de datos sea verdaderamente (y exactamente) normal.
Con las pruebas de hipótesis, generalmente uno está interesado en encontrar una prueba "poderosa", que es una prueba que puede encontrar desviaciones muy pequeñas de la hipótesis nula, con la menor cantidad de datos posible.
Intente ejecutar la prueba con una submuestra de tamaño 20, 50, 100, 200 y vea a qué tamaño comienzan a rechazar las pruebas. Es fácil ver si un histograma es simétrico y generalmente tiene forma de campana, pero las colas de la distribución son más difíciles de evaluar a simple vista. ¿Quizás hay valores atípicos en los datos que están causando el rechazo de las pruebas? Si los hay, vea lo que sucede cuando los elimina.
fuente
La causa probable es que sus datos son ligeramente no normales y el tamaño de su muestra es lo suficientemente grande como para revelar esto.
Si la distribución es realmente normal, generalmente debería pasar estas pruebas, como en el siguiente ejemplo R donde se pasan todas las pruebas menos una.
Es posible que desee hacer un qqplot y si está lo suficientemente cerca de una línea recta, entonces puede decidir tratarlo como lo suficientemente cerca de la normalidad para sus propósitos. Más bien depende de cuáles son esos propósitos.
fuente
Permítanme estar en desacuerdo con la respuesta de dsimcha: "La prueba de normalidad es una pérdida de tiempo y su ejemplo ilustra por qué". Las pruebas de normalidad nunca son una pérdida de tiempo, siempre puede aprender de sus datos. Además, hay algunas condiciones que debe probar antes de realizar algún análisis (es decir, ANOVA, regresión, etc.). Los tamaños de muestra grandes relativos son mejores para ser probados con plot (QQplot, histogram). En tales casos, la visualización proporciona mucha más información sobre el comportamiento multimodal, etc.
ANOVA y la regresión son robustos a la no normalidad cuando se trata de grandes tamaños de muestra, pero el tipo principal de datos que causan problemas son las muestras de datos multimodales.
Con un tamaño de muestra pequeño, la prueba de Kolgomorov-Smirnov es la mejor opción, principalmente debido a su sensibilidad.
fuente
Voy a estar un poco en desacuerdo con las otras respuestas publicadas hasta ahora: estas pruebas de normalidad tienen notoriamente poca potencia, incluso con tamaños de muestra relativamente grandes, al menos para ciertos tipos de desviaciones.
Aquí hay un ejemplo rápido. Generé una mezcla de dos normales cuyos medios están separados por un SD completo.
Teniendo en cuenta que "detectaría" desviaciones de la normalidad el 5% del tiempo, incluso si fuera realmente normal, eso no es muy impresionante.
Aquí hay otro ejemplo: agrego ruido uniforme en un rango del tamaño de dos desviaciones estándar. Este es bastante visiblemente no normal.
Nuevamente, potencia extremadamente baja para una gran desviación de la normalidad.
¿Estás seguro de que estás leyendo qqplot correctamente? ¿Podrías subirlo para que podamos verlo?
Editar, por otro lado, la regresión es bastante robusta a la no normalidad, por lo que estoy de acuerdo en que es probable que la inspección visual sea suficiente para la mayoría de los propósitos.
fuente