Quiero comparar 2 medias de muestra para devoluciones de existencias de 1 minuto. Supongo que están distribuidos en Laplace (ya marcados) y dividí los retornos en 2 grupos. ¿Cómo puedo verificar si son significativamente diferentes?
Creo que no puedo tratarlos como una distribución Normal, porque a pesar de que son más de 300 valores, el gráfico QQ muestra que hay una gran diferencia en una distribución Normal
Respuestas:
Suponiendo que ambas distribuciones de Laplace tengan la misma varianza,
a) la prueba de razón de probabilidad implicaría una estadística de prueba como:
Tomar registros, cancelar / simplificar y multiplicar por .- 2
donde τ = m , la desviación media absoluta de la mediana en la muestra combinada y τ i = m i , la desviación media absoluta de la mediana en la muestra i .τ^= m τ^yo= myo yo
Según el teorema de Wilks, esto se distribuye asintóticamente como bajo nulo, por lo que para una prueba del 5% rechazaría si eso excediera 3.84χ21 3.84 .
Los experimentos de simulación sugieren que la prueba es anticonservadora en muestras pequeñas (la probabilidad de rechazo es algo mayor que la nominal), pero en aproximadamente n = 100, parece ser al menos razonable (se obtiene del orden del 5,3% - 5,4% tasa de rechazo bajo nulo para una prueba nominal del 5%, por ejemplo; para parece estar más cerca del 5,25%).norte1, n2> 300
b) También esperaríamos que sería una estadística de prueba bueno (donde~μrepresenta la mediana de la muestra yv=2τ2(1μ~1- μ~2v√ μ~ ); si no he cometido un error en allí, en muestras grandes como la suya sería una distribución aproximadamente normal bajo la hipótesis nula, con media 0 y varianza 1, donde τ 2podría estar basado en el cuadrado de la desviación media absoluta de la media en la muestra combinada,m2, aunque espero que en la práctica tenderá a funcionar mejor basándolo en un promedio ponderado por la muestra de las dos muestrasm 2 i 's
†.v = 2 τ^2( 1norte1+ 1norte2) τ^2 metro2 metro2yo †
(Editar: la simulación sugiere que la aproximación normal está bien, pero el cálculo de la varianza no es correcto anteriormente; puedo ver cuál es el problema ahora pero todavía tengo que solucionarlo. La versión de permutación de esta prueba (ver ítem (c)) debería todavía estar bien).†
c) Otra alternativa sería realizar una prueba de permutación basada en cualquiera de las estadísticas anteriores. (Una de las respuestas aquí da un resumen de cómo implementar la prueba de permutación para una diferencia en las medianas).
d) Siempre se puede hacer una prueba de Wilcoxon / Mann-Whitney; será considerablemente más eficiente que intentar usar una prueba t en Laplace.
e) Mejor que (d) para los datos de Laplace sería la prueba mediana de Mood; Si bien a menudo se recomienda en los libros, cuando se trata con datos de Laplace, mostrará un buen poder. Espero que tenga un poder similar a la versión de permutación de la prueba asintótica de diferencia en medianas (una de las pruebas mencionadas en (c)).
La pregunta aquí da una implementación R que usa una prueba de Fisher, pero ese código se puede adaptar para usar una prueba de chi-cuadrado (lo cual sugeriría incluso en muestras moderadas); Alternativamente, existe un código de ejemplo para él (no como una función) aquí .
La prueba mediana se discute en Wikipedia aquí , aunque no con mucha profundidad (la traducción al alemán vinculada tiene un poco más de información). Algunos libros sobre no paramétricos lo discuten.
fuente