¿Existe una versión de prueba de equivalencia simple de la prueba de Kolmogorov-Smirnov?

13

¿Se han enmarcado dos pruebas de equivalencia unilateral (TOST) para la prueba de Kolmogorov-Smirnov para probar la hipótesis nula negativista de que dos distribuciones difieren al menos en un nivel específico del investigador?

Si no es TOST, ¿alguna otra forma de prueba de equivalencia?

Nick Stauner señala sabiamente que (ya debería saber;) que hay otras pruebas de equivalencia TOST no paramétricas para hipótesis nulas de equivalencia estocástica y, con supuestos más restrictivos, para equivalencia mediana.

Alexis
fuente
1
Relacionado: ¿ Pruebas de equivalencia para datos no normales?
Nick Stauner

Respuestas:

9

Ok, aquí está mi primer intento. ¡Un escrutinio cercano y comentarios apreciados!

Las hipótesis de dos muestras
Si podemos enmarcar las pruebas de hipótesis de Kolmogorov-Smirnov unilaterales de dos muestras , con hipótesis nulas y alternativas a lo largo de estas líneas:

H 0F Y ( t )F X ( t ) , y0FY(t)FX(t)

H AF Y ( t ) < F X ( t ) , para al menos una t , donde:AFY(t)<FX(t)t

  • D=|mint(FY(t)FX(t))|0FY(t)FX(t)

  • la estadística de prueba corresponde a H ; yD+=|maxt(FY(t)FX(t))|0FY(t)FX(t)

  • F X ( t ) Y XFY(t) y son los CDF empíricos de las muestras y ,FX(t)YX

entonces debería ser razonable crear una hipótesis de intervalo general para una prueba de equivalencia a lo largo de estas líneas (suponiendo que el intervalo de equivalencia sea simétrico por el momento):

H , y0|FY(t)FX(t)|Δ

H , para al menos una .tA|FY(t)FX(t)|<Δt

Esto se traduciría en las dos hipótesis nulas "negativistas" unilaterales específicas para probar la equivalencia (estas dos hipótesis toman la misma forma, ya que tanto como son estrictamente no negativas): D -D+D

H , o01D+Δ

H .02DΔ

Rechazando tanto H y H llevaría a concluir que . Por supuesto, el intervalo de equivalencia no necesita ser simétrico, y y podrían reemplazarse con (inferior) y (superior) para las respectivas hipótesis nulas unilaterales.- 02 -Δ<FY(t)-FX(t)<Δ-ΔΔΔ2Δ101 02Δ<FY(t)FX(t)<ΔΔΔΔ2Δ1

Las estadísticas de prueba (Actualizado: Delta está fuera del signo de valor absoluto)
Las estadísticas de prueba y (dejando implícitos y ) corresponden a H y H , respectivamente, y son: D - 2 n Y n X - 01 - 02D1+D2nYnX0102

D1+=ΔD+=Δ|maxt[(FY(t)FX(t))]|y

D2=ΔD=Δ|mint[(FY(t)FX(t))]|

El umbral de equivalencia / relevancia
El intervalo —o , si se usa un intervalo de equivalencia asimétrica — se expresa en unidades de y , o la magnitud de las probabilidades diferenciadas. A medida que y acercan al infinito, el CDF de o para acerca a para , y para :[Δ,Δ][Δ2,Δ1]D+DnYnXD+DnY,nX0t<0t0

limnY,nXp+=P(nYnXnY+nXD+t)=1e2t2

CDF de $ D ^ {+} $ (o $ D ^ {-} $)

Por lo tanto, me parece que el PDF para con escala de tamaño de muestra (o con escala de tamaño de muestra ) debe ser para y para :D+D0t<0t0

f(t)=1e2t2ddt=4te2t2

PDF de $ D ^ {+} $ (o $ D ^ {-} $)

Glen_b señala que esta es una distribución de Rayleigh con . Entonces, la función de cuantiles de muestra grande para y escala de tamaño de muestra es:σ=12D+D

CDF1=Q(p)=ln(1p)2

y una elección liberal de podría ser el valor crítico , y una elección más estricta es el valor crítico .ΔQα+σ/2=Qα+14Qα+σ/4=Qα+18

Alexis
fuente
1
En la línea donde pasas del cdf al pdf, creo que te equivocaste. Deje , entonces (abusando notación), en el límite . Entonces (tenga en cuenta la después de ). (tenga en cuenta también un signo que falta en el exponente en la línea sobre la toma de la derivada. Además, no estoy seguro de por qué tiene un símbolo integral allí, pero tal vez no KnY,nX=nYnXnY+nXD+P(K,t)=1e2t2fK(t)=ddt1e2t2=4te2t2t4
entendí
2
@stochazesthai y son dos estadísticas de prueba unilaterales. Por TOST, debe rechazar las dos hipótesis nulas a las que se aplican estas estadísticas de prueba. es un valor crítico de CDF en la línea anterior, y donde desea sub en para (por ejemplo, ). La elección de depende de qué tan lejos pase (el valor de rechazo crítico para un viejo positivista simple ) debe ir, antes de concluir la diferencia relevante (por ejemplo, 'equivalencia' liberal esD1D2Qα11αpQα=ln(1(1α))2ΔQαH014 σ más allá de ). Qα
Alexis
2
@stochazesthai (Continuación) Entonces, si tanto como , entonces rechaza . D1ΔD2ΔH0
Alexis
2
@stochazesthai ¡Vaya! Debería haber puesto las comillas alrededor de la palabra liberal en lugar de equivalencia dos comentarios atrás. :)
Alexis
2
@stochazesthai Si , rechace , si , no rechace . Si , rechace , si , no rechace . Si rechaza y , entonces rechace , de lo contrario no podrá rechazar . D1ΔH01D1<ΔH01D2ΔH02D2<ΔH02H01H02H0H0
Alexis
6

Una alternativa a TOST en las pruebas de equivalencia se basa en el enfoque del intervalo de confianza:

Supongamos que denota el margen de equivalencia preespecificado y la distancia de Kolmogorov-Smirnov entre las funciones de distribución subyacentes desconocidas.Δ

θ:=supt|FX(t)FY(t)|

Ahora, si un intervalo de confianza del 90% para está completamente dentro de , entonces podemos estar 95% seguros de que está lo suficientemente cerca de 0 como para hablar de "equivalencia".θ[Δ,Δ]θ

Sin conocer las distribuciones subyacentes, que parece ser sin esperanza para derivar un intervalo de confianza analítica aproximada, así que puede que tenga que confiar en (sesgo corregido) intervalos de confianza bootstrap basados en remuestreo a partir de pares y . (Sin embargo, no quiero encontrar condiciones para su validez en esta aplicación en particular ...)XY

Michael M
fuente
Excelente. ¿Tiene alguna cita para alguien que realice el CI de (bootstrap o de otro modo)? Dn1,n2
Alexis
1
Buen punto ... El breve documento tomswebpage.net/images/K-S_test.doc menciona el "Manual de procedimientos estadísticos paramétricos y no paramétricos, quinta edición de David J.Sheskin (27 de abril de 2011)". para ofrecer una construcción de caso de dos muestras para D. Pero por el momento, no tengo acceso a este libro.
Michael M