¿Se han enmarcado dos pruebas de equivalencia unilateral (TOST) para la prueba de Kolmogorov-Smirnov para probar la hipótesis nula negativista de que dos distribuciones difieren al menos en un nivel específico del investigador?
Si no es TOST, ¿alguna otra forma de prueba de equivalencia?
Nick Stauner señala sabiamente que (ya debería saber;) que hay otras pruebas de equivalencia TOST no paramétricas para hipótesis nulas de equivalencia estocástica y, con supuestos más restrictivos, para equivalencia mediana.
kolmogorov-smirnov
equivalence
tost
Alexis
fuente
fuente
Respuestas:
Ok, aquí está mi primer intento. ¡Un escrutinio cercano y comentarios apreciados!
Las hipótesis de dos muestras
Si podemos enmarcar las pruebas de hipótesis de Kolmogorov-Smirnov unilaterales de dos muestras , con hipótesis nulas y alternativas a lo largo de estas líneas:
H 0 : F Y ( t ) ≥ F X ( t ) , y0: FY(t)≥FX(t)
H A : F Y ( t ) < F X ( t ) , para al menos una t , donde:A: FY(t)<FX(t) t
la estadística de prueba corresponde a H ; yD+=|maxt(FY(t)−FX(t))| 0: FY(t)≤FX(t)
F X ( t ) Y XFY(t) y son los CDF empíricos de las muestras y ,FX(t) Y X
entonces debería ser razonable crear una hipótesis de intervalo general para una prueba de equivalencia a lo largo de estas líneas (suponiendo que el intervalo de equivalencia sea simétrico por el momento):
H , y−0: |FY(t)−FX(t)|≥Δ
H , para al menos una .t−A: |FY(t)−FX(t)|<Δ t
Esto se traduciría en las dos hipótesis nulas "negativistas" unilaterales específicas para probar la equivalencia (estas dos hipótesis toman la misma forma, ya que tanto como son estrictamente no negativas): D -D+ D−
H , o−01: D+≥Δ
H .−02: D−≥Δ
Rechazando tanto H y H llevaría a concluir que . Por supuesto, el intervalo de equivalencia no necesita ser simétrico, y y podrían reemplazarse con (inferior) y (superior) para las respectivas hipótesis nulas unilaterales.- 02 -Δ<FY(t)-FX(t)<Δ-ΔΔΔ2Δ1−01 −02 −Δ<FY(t)−FX(t)<Δ −Δ Δ Δ2 Δ1
Las estadísticas de prueba (Actualizado: Delta está fuera del signo de valor absoluto)D+1 D−2 nY nX −01 −02
Las estadísticas de prueba y (dejando implícitos y ) corresponden a H y H , respectivamente, y son: D - 2 n Y n X - 01 - 02
El umbral de equivalencia / relevancia[−Δ,Δ] [Δ2,Δ1] D+ D− nY nX D+ D− nY,nX 0 t<0 t≥0
El intervalo —o , si se usa un intervalo de equivalencia asimétrica — se expresa en unidades de y , o la magnitud de las probabilidades diferenciadas. A medida que y acercan al infinito, el CDF de o para acerca a para , y para :
Por lo tanto, me parece que el PDF para con escala de tamaño de muestra (o con escala de tamaño de muestra ) debe ser para y para :D+ D− 0 t<0 t≥0
Glen_b señala que esta es una distribución de Rayleigh con . Entonces, la función de cuantiles de muestra grande para y escala de tamaño de muestra es:σ=12 D+ D−
y una elección liberal de podría ser el valor crítico , y una elección más estricta es el valor crítico .Δ Qα+σ/2=Qα+14 Qα+σ/4=Qα+18
fuente
Una alternativa a TOST en las pruebas de equivalencia se basa en el enfoque del intervalo de confianza:
Supongamos que denota el margen de equivalencia preespecificado y la distancia de Kolmogorov-Smirnov entre las funciones de distribución subyacentes desconocidas.Δ
Ahora, si un intervalo de confianza del 90% para está completamente dentro de , entonces podemos estar 95% seguros de que está lo suficientemente cerca de 0 como para hablar de "equivalencia".θ [−Δ,Δ] θ
Sin conocer las distribuciones subyacentes, que parece ser sin esperanza para derivar un intervalo de confianza analítica aproximada, así que puede que tenga que confiar en (sesgo corregido) intervalos de confianza bootstrap basados en remuestreo a partir de pares y . (Sin embargo, no quiero encontrar condiciones para su validez en esta aplicación en particular ...)X Y
fuente