¿Cómo puedo comparar 2 medios que están distribuidos por Laplace?

10

Quiero comparar 2 medias de muestra para devoluciones de existencias de 1 minuto. Supongo que están distribuidos en Laplace (ya marcados) y dividí los retornos en 2 grupos. ¿Cómo puedo verificar si son significativamente diferentes?

Creo que no puedo tratarlos como una distribución Normal, porque a pesar de que son más de 300 valores, el gráfico QQ muestra que hay una gran diferencia en una distribución Normal

Robar
fuente
Pedir código / paquetes está fuera de tema aquí, pero tiene una pregunta estadística real enterrada aquí. Es posible que desee editar su pregunta para aclarar el problema estadístico subyacente. Es posible que cuando comprenda los conceptos estadísticos involucrados, los elementos específicos del software sean evidentes o al menos fáciles de obtener de la documentación.
gung - Restablece a Monica
Cuando dices "diferente", ¿estás interesado solo en la diferencia de medios, y si es así, estás asumiendo que los diferenciales son idénticos?
Glen_b -Reinstate a Monica el
Sí, solo quiero saber si los medios son significativamente diferentes y supongo que la distribución es idéntica. No creo que la desviación estándar sea idéntica, pero creo que eso también estaría bien
Rob
2
Proporcione más detalles sobre las devoluciones de existencias en 1 minuto. ¿Desea comparar medios de datos temporalmente correlacionados?
Michael M
2
Tenga en cuenta también que el número de valores que verifica no cambia la distribución; puede estar pensando en la distribución de medias muestrales , que en para un Laplace estará muy cerca de lo normal. norte=300
Glen_b -Reinstale a Monica el

Respuestas:

12

Suponiendo que ambas distribuciones de Laplace tengan la misma varianza,

a) la prueba de razón de probabilidad implicaría una estadística de prueba como:

L=yo=1norte12τ^Exp(-El |Xyo-μ^El |τ^)yo=1norte112τ^1Exp(-El |Xyo-μ^1El |τ^1)yo=norte1+1norte12τ^2Exp(-El |Xyo-μ^2El |τ^2)

Tomar registros, cancelar / simplificar y multiplicar por .-2

-2l=2(norteIniciar sesión(τ^)-norte1Iniciar sesión(τ^1)-norte2Iniciar sesión(τ^2))(donde )l=Iniciar sesión(L)

donde τ = m , la desviación media absoluta de la mediana en la muestra combinada y τ i = m i , la desviación media absoluta de la mediana en la muestra i .τ^=metroτ^yo=metroyoyo

Según el teorema de Wilks, esto se distribuye asintóticamente como bajo nulo, por lo que para una prueba del 5% rechazaría si eso excediera 3.84χ123.84.

Los experimentos de simulación sugieren que la prueba es anticonservadora en muestras pequeñas (la probabilidad de rechazo es algo mayor que la nominal), pero en aproximadamente n = 100, parece ser al menos razonable (se obtiene del orden del 5,3% - 5,4% tasa de rechazo bajo nulo para una prueba nominal del 5%, por ejemplo; para parece estar más cerca del 5,25%).norte1,norte2>300

b) También esperaríamos que sería una estadística de prueba bueno (donde~μrepresenta la mediana de la muestra yv=2τ2(1μ~1-μ~2vμ~); si no he cometido un error en allí, en muestras grandes como la suya sería una distribución aproximadamente normal bajo la hipótesis nula, con media 0 y varianza 1, donde τ 2podría estar basado en el cuadrado de la desviación media absoluta de la media en la muestra combinada,m2, aunque espero que en la práctica tenderá a funcionar mejor basándolo en un promedio ponderado por la muestra de las dos muestrasm 2 i 's .v=2τ^2(1norte1+1norte2)τ^2metro2metroyo2

(Editar: la simulación sugiere que la aproximación normal está bien, pero el cálculo de la varianza no es correcto anteriormente; puedo ver cuál es el problema ahora pero todavía tengo que solucionarlo. La versión de permutación de esta prueba (ver ítem (c)) debería todavía estar bien).

c) Otra alternativa sería realizar una prueba de permutación basada en cualquiera de las estadísticas anteriores. (Una de las respuestas aquí da un resumen de cómo implementar la prueba de permutación para una diferencia en las medianas).

d) Siempre se puede hacer una prueba de Wilcoxon / Mann-Whitney; será considerablemente más eficiente que intentar usar una prueba t en Laplace.

e) Mejor que (d) para los datos de Laplace sería la prueba mediana de Mood; Si bien a menudo se recomienda en los libros, cuando se trata con datos de Laplace, mostrará un buen poder. Espero que tenga un poder similar a la versión de permutación de la prueba asintótica de diferencia en medianas (una de las pruebas mencionadas en (c)).

La pregunta aquí da una implementación R que usa una prueba de Fisher, pero ese código se puede adaptar para usar una prueba de chi-cuadrado (lo cual sugeriría incluso en muestras moderadas); Alternativamente, existe un código de ejemplo para él (no como una función) aquí .

La prueba mediana se discute en Wikipedia aquí , aunque no con mucha profundidad (la traducción al alemán vinculada tiene un poco más de información). Algunos libros sobre no paramétricos lo discuten.

Glen_b -Reinstate a Monica
fuente
¡Muchas gracias! ¿Puedo usar el estadístico de prueba que usó y rechazarlo si se supera el cuantil de Laplace para media = 0 y desviación estándar = 1 como lo haría con la prueba de distribución Normal?
Rob
μ^τ^χ22
¿O tal vez utilizó una sola estimación para la escala en el modelo alternativo?
P.Windridge
χ12