Tengo dos conjuntos de datos que se centran aproximadamente en cero, pero sospecho que tienen colas diferentes. Conozco algunas pruebas para comparar la distribución con una distribución normal, pero me gustaría comparar directamente las dos distribuciones.
¿Existe una prueba simple para comparar la gordura de la cola de 2 distribuciones ?
Gracias
fred
hypothesis-testing
distributions
kurtosis
fat-tails
RockScience
fuente
fuente
Respuestas:
Esta pregunta parece pertenecer a la misma familia que la anterior sobre probar si dos muestras tienen el mismo sesgo , por lo que es posible que desee leer mi respuesta a eso . Creo que los momentos L también serían útiles aquí por las mismas razones (específicamente la curtosis de
asimetríaLen este caso).fuente
Al construir un umbral, diciendo lambda, podemos probar la igualdad de dos medias o las variaciones de las dos distribuciones restringidas en la región de cola (\ lambda, infinito) en base a dos conjuntos de datos de observaciones que caen en esta región de cola. Por supuesto, la prueba t de dos muestras o la prueba F pueden estar bien pero no ser potentes ya que la variable aleatoria restringida en esta región de cola no es normal, incluso las originales lo son.
fuente
¿Qué hay de ajustar la distribución generalizada de lambda y los intervalos de confianza de bootstrapping en los parámetros tercero y cuarto?
fuente
La prueba de Chi cuadrado (prueba de bondad de ajuste) será muy buena para comparar las colas de dos distribuciones, ya que está estructurada para comparar dos distribuciones por segmentos de valores (representados gráficamente por un histograma). Y, las colas consistirán en la mayoría de los cubos.
Aunque esta prueba se centra en toda la distribución, no solo en la cola se puede observar fácilmente cuánto del valor de Chi cuadrado o divergencia se deriva de la diferencia en la gordura de las colas.
Observe que el histograma derivado en realidad puede brindarle visualmente mucha más información con respecto a la respectiva gordura de las colas que cualquier significación estadística relacionada con la prueba. Una cosa es afirmar que la gordura de las colas es estadísticamente diferente. Es otro observarlo visualmente. Dicen que una imagen vale más que mil palabras. A veces también vale mil números (tiene sentido dado que los gráficos encapsulan todos los números).
fuente