Recientemente me di cuenta de que existen diferencias en los valores de curtosis proporcionados por SPSS y Stata.
Ver http://www.ats.ucla.edu/stat/mult_pkg/faq/general/kurtosis.htm
Tengo entendido que la interpretación de lo mismo, por lo tanto, sería diferente.
¿Algún consejo sobre cómo lidiar con esto?
spss
stata
interpretation
kurtosis
Cesare Camestre
fuente
fuente
Respuestas:
Las tres fórmulas
Tres fórmulas para la curtosis generalmente son utilizadas por diferentes programas. Enunciaré las tres fórmulas ( , G 2 y b 2 ) y los programas que las usan.g2 G2 b2
La primera fórmula y la definición típica utilizada en muchos libros de texto es (esta es la segunda fórmula en el enlace que ha proporcionado) dondemrdenota losmomentos de muestra:
A veces, se agrega un término de corrección de -3 a esta fórmula para que una distribución normal tenga una curtosis de 0. La fórmula de curtosis con un término de -3 se llama curtosis en exceso (la primera fórmula en el enlace que ha proporcionado).
La segunda fórmula es (utilizada por SAS, SPSS y MS Excel; esta es la tercera fórmula en el enlace que ha proporcionado)
donde es la curtosis como se define en la primera fórmula.sol2
La tercera fórmula es (utilizada por MINITAB y BMDP)
donde es la varianza muestral imparcial :s2
Ensol2- 3 sol2 si2
R
la curtosis se puede calcular utilizando lakurtosis
función dele1071
paquete (enlace aquí ). La opcióntype
determina cuál de las tres fórmulas se usa para los cálculos (1 = , 2 = G 2 , 3 = b 2 ).Estos dos documentos discuten y comparan las tres fórmulas: primero , segundo .
Resumen de las diferencias entre las fórmulas.
Consulte también la página de Wikipedia y la página de MathWorld sobre curtosis.
fuente
El enlace en cuestión también habla de SAS. Pero, de hecho, nada en esta pregunta, excepto posiblemente el propio enfoque del afiche, lo limita a esos programas nombrados en particular.
Creo que necesitamos separar aquí diferentes tipos de problemas, algunos de los cuales son ilusorios y otros genuinos.
Algunos programas restan 3 y otros no, de modo que la medida de curtosis informada es 3 para variables gaussianas / normales sin resta y 0 con resta. He visto personas desconcertadas por eso, a menudo cuando la diferencia resulta ser 2.999 y no exactamente 3.
Algunos programas usan factores de corrección diseñados para garantizar que la curtosis se calcule sin sesgos. Estos factores de corrección se aproximan a 1 a medida que el tamaño de la muestra aumenta . Como la curtosis no se estima bien en muestras pequeñas de ninguna manera, esto no debería ser motivo de gran preocupación.norte
Entonces, hay un pequeño problema con las fórmulas, ya que el n. ° 1 es mucho más grande que el n. ° 2, pero ambos son menores si se comprenden. El consejo claramente es mirar la documentación del programa que está utilizando, y si no hay documentación que explique ese tipo de detalles para abandonar ese programa de inmediato. Pero un caso de prueba tan simple como una variable (1, 2) produce una curtosis de 1 o 4 dependiendo del # 1 solo (sin factor de corrección).
La pregunta luego se refiere a la interpretación, pero este es un asunto mucho más abierto y contencioso.
Antes de llegar al área principal de discusión, una dificultad a menudo informada pero poco conocida es que las estimaciones de curtosis están limitadas en función del tamaño de la muestra. Escribí una reseña en Cox, NJ 2010. Los límites de la asimetría de la muestra y la curtosis. Stata Journal 10 (3): 482-495. http://www.stata-journal.com/article.html?article=st0204
Resumen: La asimetría de la muestra y la curtosis están limitadas por las funciones del tamaño de la muestra. Los límites, o aproximaciones a ellos, se han redescubierto en varias ocasiones durante las últimas décadas, pero, sin embargo, parecen ser poco conocidos. Los límites imparten sesgo a la estimación y, en casos extremos, implican que ninguna muestra podría dar testimonio exacto de su distribución original. Los principales resultados se explican en una revisión tutorial, y se muestra cómo Stata y Mata pueden usarse para confirmar y explorar sus consecuencias.
Ahora, a lo que comúnmente se considera el meollo del asunto:
Muchas personas traducen la curtosis como pico, pero otros enfatizan que a menudo sirve como una medida del peso de la cola. De hecho, las dos interpretaciones podrían ser ambas palabras razonables para algunas distribuciones. Es casi inevitable que no haya una interpretación verbal simple de la curtosis: nuestro lenguaje no es lo suficientemente rico en las comparaciones de sumas de cuartos poderes de desviaciones de las medias y sumas de segundos poderes de los mismos.
En un clásico menor, que a menudo se pasa por alto, Irving Kaplansky (1945a) llamó la atención sobre cuatro ejemplos de distribuciones con diferentes valores de curtosis y comportamientos no consistentes con algunas discusiones sobre curtosis.
Es instructivo trazar estas densidades. Los usuarios de Stata pueden descargar mi
kaplansky
programa desde SSC. Usar una escala logarítmica para la densidad puede ayudar.Sin revelar todos los detalles, estos ejemplos socavan cualquier historia simple de que la curtosis baja o alta tiene una interpretación clara en términos de pico o incluso de cualquier otro contraste único.
Si el nombre de Irving Kaplansky suena, es probable que conozcas su trabajo en álgebra moderna. Él (1917-2006) fue un matemático canadiense (luego estadounidense) y enseñó e investigó en Harvard, Chicago y Berkeley, con un año de guerra en el Grupo de Matemáticas Aplicadas del Consejo de Defensa Nacional de la Universidad de Columbia. Kaplansky realizó importantes contribuciones a la teoría de grupos, la teoría de los anillos, la teoría de álgebras de operadores y la teoría de campos. Fue un consumado pianista y letrista y un entusiasta y lúcido expositor de las matemáticas. Tenga en cuenta también algunas otras contribuciones a la probabilidad y las estadísticas de Kaplansky (1943, 1945b) y Kaplansky y Riordan (1945).
Kaplansky, I. 1943. Una caracterización de la distribución normal. Annals of Mathematical Statistics 14: 197-198.
Kaplansky, I. 1945a. Un error común con respecto a la curtosis. Revista, Asociación Americana de Estadística 40: 259 solamente.
Kaplansky, I. 1945b. La distribución asintótica de corridas de elementos consecutivos. Anales de Estadística Matemática 16: 200-203.
Kaplansky, I. y Riordan, J. 1945. Emparejamiento múltiple y ejecuciones por el método simbólico. Anales de Estadística Matemática 16: 272-277.
fuente