Varianza de la media muestral de la muestra bootstrap

9

Deje que sean observaciones distintas (sin vínculos). Deje que denote una muestra de bootstrap (una muestra del CDF empírico) y deje . Busque y .X1,...,XnX1,...,XnX¯n=1ni=1nXiE(X¯n)Var(X¯n)

Lo que tengo hasta ahora es que es cada uno con probabilidad entonces y que da XiX1,...,Xn1n

E(Xi)=1nE(X1)+...+1nE(Xn)=nμn=μ
E(Xi2)=1nE(X12)+...+1nE(Xn2)=n(μ2+σ2)n=μ2+σ2,
Var(Xi)=E(Xi2)(E(Xi))2=μ2+σ2μ2=σ2.

Entonces, y desde ' s son independientes. Esto proporciona

E(X¯n)=E(1ni=1nXi)=1ni=1nE(Xi)=nμn=μ
Var(X¯n)=Var(1ni=1nXi)=1n2i=1nVar(Xi)
XiVar(X¯n)=nσ2n2=σ2n

Sin embargo, no obtengo la misma respuesta cuando condiciono en y uso la fórmula para la varianza condicional: X1,,Xn

Var(X¯n)=E(Var(X¯n|X1,...,Xn))+Var(E(X¯n|X1,,Xn)).

E(X¯n|X1,,Xn)=X¯n y Var(X¯n|X1,,Xn)=1n2(Xi2nX¯n2) así que al conectarlos a la fórmula anterior se obtiene (después de un poco de álgebra) Var(X¯n)=(2n1)σ2n2 .

¿Estoy haciendo algo mal aquí? Mi sensación es que no estoy usando la fórmula de varianza condicional correctamente, pero no estoy seguro. Cualquier ayuda sería apreciada.

rrruss
fuente
Tal vez su V (E (X | X1..Xn)) no se calcula correctamente. La respuesta debería ser la misma.
Probablemente tenga razón, pero esta respuesta no parece terriblemente informativa. ¿Quizás podría señalar qué parte no es correcta?
whuber

Respuestas:

5

La respuesta correcta es . La solución es la # 4 aquín1n2S2

Greg
fuente
4

Esta puede ser una respuesta tardía, pero lo que está mal en su cálculo es lo siguiente: ha asumido que incondicionalmente su muestra de bootstrap es iid. Esto es falso: condicional en su muestra, la muestra de bootstrap es de hecho iid, pero incondicionalmente pierde independencia (pero aún tiene variables aleatorias distribuidas de forma idéntica). Esto es esencialmente el Ejercicio 13 en Larry Wasserman Todas las estadísticas no paramétricas .

M Turgeon
fuente