¿Qué pasa si las probabilidades no son iguales en la "Regla .632"?

11

Esta pregunta se deriva de esta sobre la "Regla .632". Estoy escribiendo con referencia particular a la respuesta / notación de user603 en la medida en que simplifica las cosas.

Esa respuesta comienza con una muestra de tamaño con sustitución, de n elementos distintos en la colección (llamada) que N. La probabilidad de que la i t h muestra es i es diferente de un elemento en particular m de N es entonces ( 1 - 1 / n ) .n,nithsim(11/n).

En esa respuesta, todos los elementos de N tienen la misma probabilidad de ser dibujados al azar.

Mi pregunta es la siguiente: supongamos, en cambio, que en la pregunta anterior, los elementos a dibujar son tales que normalmente se distribuyen. Es decir, subdividimos la curva normal estándar de Z=4 a Z=4 en (digamos) 100 subintervalos de igual longitud. Cada uno de los 100 elementos en N tiene una probabilidad de ser dibujada que es igual al área subtendida por la curva en su intervalo respectivo.

Mi pensamiento fue el siguiente:

El razonamiento es similar al de la respuesta vinculada, creo. La probabilidad de que sim , con m un elemento de N, es P(sim)=(1Fi) en la que Fi es la probabilidad de sacar si.

La probabilidad de que un elemento particular m esté en la muestra S de tamaño n es

= 1 - n 1 ( 1 - F i ) .

P(mS)=1P(mS)=11nP(sim)
=11n(1Fi).

Un cálculo parece mostrar que a medida que la longitud de los subintervalos se reduce, la respuesta converge al mismo número que en el primer caso (las probabilidades de todas iguales).si

Esto parece contradictorio (para mí) porque la construcción parece incluir elementos de N que son raros, por lo que esperaría un número menor que .632.

Además, si esto es correcto, supongo que tendríamos

limn1n(1Fi)=lim(11/n)n=1/e,

que todavía no sé si es verdadero o falso.

Editar: si es cierto, probablemente generalizaría algunos.

Gracias por cualquier idea.

daniel
fuente
Acabo de preguntar sobre la última ecuación en Matemáticas SE (pregunta 791114) porque también estoy interesado en cómo se generaliza, si es que lo hace.
Daniel
... y la respuesta corta es que la última igualdad es correcta para archivos PDF con buen comportamiento, por lo que la respuesta a la pregunta es que la regla .632 es válida para una amplia variedad de distribuciones subyacentes.
Daniel
¿Puedo levantar la respuesta de otra persona de otro sitio y publicarla aquí como mía? Por eso publiqué el breve comentario. Tal vez hay una forma aceptada de hacer esto, si es así, estoy dispuesto.
daniel
por supuesto que puedes, solo menciona la fuente en algún momento :)
Firebug
@Firebug: ¿puedes señalar una instancia en la que esto se haga para que yo pueda ver a qué te refieres? Gracias.
daniel

Respuestas:

2

La pregunta se refiere al comportamiento limitante de

(1)=1i=1n(1Fi)

a medida que crece y el contrae uniformemente de tal manera que (a) todos son no negativos y (b) suman la unidad. (Estos se derivan de la construcción de y los axiomas de probabilidad).nFi Fi

Por definición, este producto es el exponencial de su logaritmo:

i=1n(1Fi)=exp(i=1nlog(1Fi)).

El teorema de Taylor (con la forma Lagrange del resto) , aplicado a , establece quelog

log(1Fi)=Fi12ϕi2Fi12Fi2

para algunos en el intervalo . En otras palabras, estos logaritmos equivalen a hasta términos que son a lo sumo veces . Pero cuando es lo suficientemente grande como para asegurar que todos los son más pequeños que algunos dados (una condición asegurada por la contracción uniforme de ), entonces (b) implica y por lo tantoϕi[0,Fi] 1 / 2 F 2 i n F i ε > 0 F i n ε > Σ F i = 1Fi 1/2Fi2nFiϵ>0Finϵ>Fi=1

i=1nFi2i=1nϵ2<i=1n(1n)2=1n.

Por consiguiente

1=i=1nFii=1nlog(1Fi)i=1nFi121n=112n

exprime el logaritmo entre dos secuencias que convergen en . Como es continuo, el producto converge al exponencial de este límite, . Por consiguiente1expi=1n(1Fi)exp(1)

limn(1i=1n(1Fi))=1exp(1)0.632,

QED .


Una mirada más cercana a este análisis establece que el error en esta aproximación (que siempre será un límite inferior ) no es mayor en tamaño que Por ejemplo, la división de una distribución Normal estándar en cortes entre y produce un máximo cerca del modo , donde será aproximadamente igual al área de un rectángulo allí, . El límite anterior establece que el valor de la fórmula estará dentro de de su valor límite. El error real es un orden de magnitud menor,n=400-44 F i 0exp(-1 / 2) / 500,012(1)0,0110,001041 f i 1

(exp((n/2)max(Fi2))1)exp(1).
n=40044Fi0exp(1/2)/500.012(1)0.0110.001041 . Aquí está el cálculo en R( en el que podemos confiar porque ninguno de los es realmente pequeño en relación con ):fi1
f <- diff(pnorm(seq(-4, 4, length.out=401))) # The normal "slices".
f <- f / sum(f)                              # Make them sum to unity.
exp(-1) - prod(1 - f)                        # Compute the error.

De hecho, 1 - prod(1-f)es mientras que es .1 - exp ( - 1 ) 0.6321206 0.63316151exp(1)0.6321206

whuber
fuente
2
El análisis de errores es un aspecto muy útil de esta respuesta.
Daniel