Deje que sean observaciones distintas (sin vínculos). Deje que denote una muestra de bootstrap (una muestra del CDF empírico) y deje . Busque y .X1,...,XnX∗1,...,X∗nX¯∗n=1n∑ni=1X∗iE(X¯∗n)Var(X¯∗n)
Lo que tengo hasta ahora es que es cada uno con probabilidad entonces
y
que da
X∗iX1,...,Xn1n
E(X∗i)=1nE(X1)+...+1nE(Xn)=nμn=μ
E(X∗2i)=1nE(X21)+...+1nE(X2n)=n(μ2+σ2)n=μ2+σ2,
Var(X∗i)=E(X∗2i)−(E(X∗i))2=μ2+σ2−μ2=σ2.
Entonces,
y
desde ' s son independientes. Esto proporciona
E(X¯∗n)=E(1n∑i=1nX∗i)=1n∑i=1nE(X∗i)=nμn=μ
Var(X¯∗n)=Var(1n∑i=1nX∗i)=1n2∑i=1nVar(X∗i)
X∗iVar(X¯∗n)=nσ2n2=σ2n
Sin embargo, no obtengo la misma respuesta cuando condiciono en y uso la fórmula para la varianza condicional:
X1,…,Xn
Var(X¯∗n)=E(Var(X¯∗n|X1,...,Xn))+Var(E(X¯∗n|X1,…,Xn)).
E(X¯∗n|X1,…,Xn)=X¯n y Var(X¯∗n|X1,…,Xn)=1n2(∑X2i−nX¯2n) así que al conectarlos a la fórmula anterior se obtiene (después de un poco de álgebra) Var(X¯∗n)=(2n−1)σ2n2 .
¿Estoy haciendo algo mal aquí? Mi sensación es que no estoy usando la fórmula de varianza condicional correctamente, pero no estoy seguro. Cualquier ayuda sería apreciada.
Respuestas:
La respuesta correcta es . La solución es la # 4 aquín−1n2S2
fuente
Esta puede ser una respuesta tardía, pero lo que está mal en su cálculo es lo siguiente: ha asumido que incondicionalmente su muestra de bootstrap es iid. Esto es falso: condicional en su muestra, la muestra de bootstrap es de hecho iid, pero incondicionalmente pierde independencia (pero aún tiene variables aleatorias distribuidas de forma idéntica). Esto es esencialmente el Ejercicio 13 en Larry Wasserman Todas las estadísticas no paramétricas .
fuente