He estado trabajando en el muestreo de importancia bastante de cerca durante el año pasado y tengo algunas preguntas abiertas con las que esperaba obtener ayuda.
Mi experiencia práctica con esquemas de muestreo de importancia ha sido que ocasionalmente pueden producir fantásticas estimaciones de baja varianza y bajo sesgo. Sin embargo, con mayor frecuencia tienden a producir estimaciones de alto error que tienen una varianza de muestra baja pero un sesgo muy alto.
Me pregunto si alguien puede explicar exactamente qué tipo de factores afectan la validez de las estimaciones de muestreo de importancia. En particular, me pregunto:
1) ¿Se garantiza que las estimaciones de muestreo de importancia converjan al resultado correcto cuando la distribución de polarización tiene el mismo soporte que la distribución original? Si es así, ¿por qué parece que esto toma tanto tiempo en la práctica?
2) ¿Existe una relación cuantificable entre el error en una estimación producida a través del muestreo de importancia y la "calidad" de la distribución de polarización (es decir, cuánto coincide con la distribución de varianza cero)
3) Parcialmente basado en 1) y 2): ¿hay alguna manera de cuantificar 'cuánto' debe saber sobre una distribución antes de que fuera mejor usar un diseño de muestreo de importancia que un método simple de Monte Carlo?
So, intuitvely, to get small bias and small variance, you wantVarg(ω(X)) to be small and Covg(ω(X),h(X)ω(X)) to be positive. Unfortunately these approximations are not perfect (and accurately determining the variances and covariances is likely to be as difficult as solving the initial problem).
fuente