Observo los tiempos de procesamiento de un proceso antes y después de un cambio para averiguar si el proceso ha mejorado con el cambio. El proceso ha mejorado si se reduce el tiempo de procesamiento. La distribución del tiempo de procesamiento es de cola gruesa, por lo que la comparación basada en el promedio no es razonable. En cambio, me gustaría saber si la probabilidad de observar un menor tiempo de procesamiento después del cambio es significativamente superior al 50%.
Sea la variable aleatoria para el tiempo de procesamiento después del cambio e Y la anterior. Si P ( X < Y ) está significativamente por encima de 0.5, entonces diría que el proceso ha mejorado.
Ahora tengo observaciones xi i de X y m observaciones y j de Y . La observada probabilidad de P ( X < Y ) es p = 1.
¿Qué puedo decir sobre dadas las observaciones x i e y j ?
fuente
@jbowman proporciona una solución estándar (agradable) al problema de estimar que se conoce como modelo de resistencia al estrés .θ = P( X< Y)
Se propuso otra alternativa no paramétrica en Baklizi y Eidous (2006) para el caso en que e Y son independientes. Esto se describe a continuación.X Y
Por definición tenemos eso
donde es la CDF de X y f Y es la densidad de Y . Luego, usando las muestras de X e Y , podemos obtener estimadores del núcleo de F X y f Y y, en consecuencia, un estimador de θFX X FY Y X Y FX FY θ
Esto se implementa en el siguiente código R utilizando un núcleo gaussiano.
Para obtener un intervalo de confianza para , puede obtener una muestra de arranque de este estimador de la siguiente manera.θ
También se pueden considerar otros tipos de intervalos de arranque.
fuente
fuente