Quiero estimar la media de una función f, es decir,
donde
EX,Y[f(X,Y)]
X e
Y son variables aleatorias independientes. Tengo muestras de f pero no de iid: hay muestras de iid para
Y1,Y2,…Yn y para cada
Yi hay
ni muestras de
X :
Xi,1,Xi,2,…,Xi,ni
Entonces, en total, tengo muestras f(X1,1,Y1)…f(X1,n1,Y1)…f(Xi,j,Yi)…f(Xn,nn,Yn)
Para estimar la media calculo
μ=∑i=1n1/n∗∑j=1nif(Xi,j,Yi)ni
Obviamente
EX,Y[μ]=EX,Y[f(X,Y)]
entonces
μes un estimador imparcial. Me pregunto ahora qué
Var(μ), es decir, la varianza del estimador es.
Edición 2: ¿Es esta la varianza correcta?
Parece funcionar en el límite, es decir, si n = 1 y todoni=∞la varianza se convierte en la varianza de las medias. Y sini=1,la fórmula se convierte en la fórmula estándar para la varianza de los estimadores. ¿Es esto correcto? ¿Cómo puedo probar que es así?
Var(μ)=VarY(μi)n+∑i=1nVarX(f(X,Yi)))ni∗n2
ni=∞ni=1
Editar (ignorar esto):
Así que creo que hice algunos progresos: definamos primero que es un estimador imparcial deEX[f(X,Yi)].μi=∑nij=1f(Xi,j,Yi)niEX[f(X,Yi)]
Usando la fórmula estándar para la varianza podemos escribir:
Esto se puede simplificar a
1 / n 2 ( n ∑ i = 1 V a r ( μ l ) + 1 / n 2 n ∑ l = 1
Var(μ)=1/n2∑l=1n∑k=1nCov(μl,μk)
y debido a que las
Xijs se dibujan independientemente, podemos simplificar esto a
1/n2( n ∑ i = 1 1/niVar(f(Xi,j,Yi))+11 / n2( ∑i = 1norteVa r ( μl) + 1 / n2∑l = 1norte∑k = l + 1norte2 ∗ Co v ( μl, μk) )
Xyo j
Y para la covarianza:
C o v ( μ l , μ k )1 / n2( ∑i = 1norte1 / nyoVa r ( f( Xi , j, Yyo) ) + 1 / n2∑l = 1norte∑k = l + 1norte2 ∗ Co v ( μl, μk) )
Así que volviendo a conectar esto obtenemos
1/n2( n ∑ i = 1 1/niVar(f(X,Yi))+1/n2 n ∑ l = 1 nCo v ( μl, μk)= Co v ( ∑j = 1nortelF( Xj , l, Yl)nortel, ∑j = 1nortekF( Xj , k, Yk)nortek)= 1( nk∗ nl)∗ Co v ( ∑j = 1nortelF( Xj , l, Yl) , ∑j = 1nortekF( Xj , k, Yk) )= 1( nk∗ nl)∗ ∑j = 1nortel∑j = 1nortekCo v ( f( X, Yl) , f( X, Yk) )= nk∗ nl( nk∗ nl)Co v ( f( Xyo , yo, Yl) , f( Xi , k, Yk) )= Co v ( f( X, Yl) , f( X, Yk) )
Ahora tengo varias preguntas:
1 / n2( ∑i = 1norte1 / nyoVa r ( f( X, Yyo) ) + 1 / n2∑l = 1norte∑k = l + 1norte2 ∗ Co v ( f( X, Yl) , f( X, Yk) ) )
¿Es correcto el cálculo anterior?
¿Cómo puedo estimar partir de las muestras dadas?Co v ( f( X, Yl) , f( X, Yk) ) )
¿La varianza converge a 0 si dejo n ir al infinito?