Dados dos conjuntos de datos de números reales positivos X e Y, ambos del mismo tamaño, y 0 <= Y <= X para cada fila; ¿Puede el CDF empírico de X cruzar alguna vez el CDF empírico de Y?
fuente
Dados dos conjuntos de datos de números reales positivos X e Y, ambos del mismo tamaño, y 0 <= Y <= X para cada fila; ¿Puede el CDF empírico de X cruzar alguna vez el CDF empírico de Y?
El cdf empírico, es la proporción de la muestra en o por debajo de .
Considere ordenar sus filas aumentando (y a un valor fijo de , ordenando aumentando ).
Luego, para cada fila (fila , por ejemplo), la altura de cada cdf es *, y la abscisa correspondiente para la muestra x siempre está a la derecha de la abscisa para la muestra y. Las funciones escalonadas pueden coincidir, pero el ecdf de muestra x nunca estará arriba / a la izquierda del ecdf de muestra y.
De hecho, imagine que "dibujamos en la trama" todos los saltos verticales en el ecdf. Luego, una línea horizontal dibujada a través de la gráfica en algún valor de golpeará los pasos de ecdf en un valor particular de y que aparece en nuestra tabla que enumera los valores de muestra en orden (de hecho, para un valor dado de , es fácil determine qué fila será ), que siempre tiene .
* (es un poco más complicado cuando hay valores duplicados, pero no de una manera que cambie sustancialmente el argumento)
Para la línea horizontal gris en la gráfica ( ), golpea los saltos verticales del ecdf en y que ocurren en la fila 73 de la tabla de datos cuando se ordenan como se indicó anteriormente.
La respuesta de Glen_b es correcta, pero creo que hay una forma aún más simple de demostrar esto.
El eCDF es un gráfico de ( , proporción de valores en o por debajo de ). Comenzamos clasificando los valores en orden ascendente: e . Además, a partir de su pregunta, sabemos que los dos vectores tienen la misma longitud y para cada índice .
Dado que es mayor o igual que , debe ubicarse a la derecha o hacia la derecha de y, dado que son los puntos más pequeños de la lista, ambos tienen una coordenada altura / y de . Ambas curvas se mueven hacia arriba a la misma velocidad ( por paso) y hacia la derecha. Sin embargo, dado que , la curva se mueve al menos tan a la derecha como la curva en cada paso.
Dado que la curva comenzó a la derecha o hacia la derecha de la curva y cada actualización posterior empuja al menos tan a la derecha como , las curvas nunca se cruzan.
Solo formalice lo que se escribió arriba:
Si los CDF empericales se escriben como y respectivamente, entonces
y asimismo .
Ahora, para cualquier , podemos mostrar que . Demuestre esto por contradicción: suponga que hay una donde esto no se cumple y demuestre que debe haber un par para el cual .
Por lo tanto, para todas las .
Nota: Hay algunas suposiciones implícitas en esta demostración de que el número de puntos de datos es finito. Supongo que es posible tener conjuntos de datos infinitos del mismo tamaño (es decir, cardinalidad). Estoy bastante seguro de que el resultado se cumple, pero mucho menos seguro acerca de la prueba de tal resultado.