¿Qué es el muestreo de importancia?

Respuestas:

15

El muestreo de importancia es una forma de muestreo de una distribución diferente de la distribución de interés para obtener más fácilmente mejores estimaciones de un parámetro de la distribución de interés. Normalmente, esto proporcionará estimaciones del parámetro con una varianza menor que la que se obtendría al tomar muestras directamente de la distribución original con el mismo tamaño de muestra.

Se aplica en varios contextos. En general, el muestreo de la distribución diferente permite tomar más muestras en una parte de la distribución de interés que dicta la aplicación (región importante).

Un ejemplo podría ser que desea tener una muestra que incluya más muestras de las colas de la distribución de lo que proporcionaría un muestreo aleatorio puro de la distribución de interés.

El artículo de Wikipedia que he visto sobre este tema es demasiado abstracto. Es mejor mirar varios ejemplos específicos. Sin embargo, sí incluye enlaces a aplicaciones interesantes como Bayesian Networks.

Un ejemplo de muestreo importante en las décadas de 1940 y 1950 es una técnica de reducción de varianza (una forma del Método Monte Carlo). Véase, por ejemplo, el libro Monte Carlo Methods de Hammersley y Handscomb publicado como Methuen Monograph / Chapman and Hall en 1964 y reimpreso en 1966 y más tarde por otros editores. La sección 5.4 del libro cubre el muestreo de importancia.

Michael R. Chernick
fuente
2
Para agregar a esto: en RL, generalmente está aplicando un muestreo de importancia a la política: por ejemplo, acciones de muestreo de una política de exploración en lugar de la política real que realmente desea probar
DaVinci
3
Esta respuesta comienza bien explicando qué importancia tiene el muestreo , pero me decepcionó descubrir que en realidad nunca responde a la pregunta de qué importancia es el muestreo : ¿cómo funciona?
whuber
@whuber Mi objetivo aquí era explicar el concepto a un OP confundido y señalarle algo de literatura. Es un gran tema y se usa en aplicaciones aparentemente diferentes. Otros pueden explicar los detalles en términos simples mejor que yo. Sé que cuando decides responder una pregunta, te vuelves loco y proporcionas buenos gráficos, revisas los detalles técnicos usando un lenguaje sencillo. Esas publicaciones casi siempre satisfacen a la comunidad con su claridad e integridad, y me atrevo a decir que también satisface el OP al menos en parte. Tal vez unas pocas oraciones con ecuaciones basten como sugiere.
Michael R. Chernick
Tal vez sea mejor para la comunidad responder a la pregunta en lugar de solo señalar otras fuentes o incluso proporcionar enlaces. Simplemente sentí que lo que hice fue adecuado y el OP que admite ser un novato en estadística debería hacer un esfuerzo por su cuenta primero.
Michael R. Chernick
55
Usted tiene un punto. Sin embargo, me pregunto si podría ser posible en solo una o dos oraciones más, sin matemáticas, sin gráficos, casi sin trabajo adicional, para dar una respuesta a la pregunta que se le hizo. En este caso, la descripción tendría que enfatizar que uno está estimando la expectativa (no cualquier "parámetro"), luego tal vez señalar que dado que la expectativa suma un producto de valores y probabilidades, uno obtiene el mismo resultado al cambiar las probabilidades ( a aquellos de una distribución que es fácil de probar) y ajustando los valores para compensar eso.
whuber
33

El muestreo de importancia es un método de simulación o Monte Carlo destinado a la aproximación de integrales. El término "muestreo" es algo confuso en el sentido de que no tiene la intención de proporcionar muestras de una distribución dada.

La intuición detrás del muestreo de importancia es que una integral bien definida, como puede expresarse como una expectativa para un amplio rango de distribuciones de probabilidad: I = E f [ H ( X ) ] = X H ( x ) f ( x )

I=Xh(x)dx
donde f denota la densidad de una distribución de probabilidad y H está determinado por h y f . (Tenga en cuenta que H ( ) suele ser diferente de h ( ) .)De hecho, la elección H ( x ) = h ( x )
I=Ef[H(X)]=XH(x)f(x)dx
fHhfH()h() conduce a las igualdadesH(x)f(x)=h(x)eI=Ef[H(X)]-bajo algunas restricciones en el soporte def, lo que significaf(x)>0cuandoh(x)0-
H(x)=h(x)f(x)
H(x)f(x)=h(x)I=Ef[H(X)]ff(x)>0h(x)0. Por lo tanto, como señaló W. Huber en su comentario, no hay unicidad en la representación de una integral como una expectativa, sino por el contrario, una variedad infinita de tales representaciones, algunas de las cuales son mejores que otras una vez como criterio para comparar ellos es adoptado. Por ejemplo, Michael Chernick menciona elegir para reducir la varianza del estimador.f

Una vez que se comprende esta propiedad elemental, la implementación de la idea es confiar en la Ley de Números Grandes como en otros métodos de Monte Carlo, es decir, simular [a través de un generador pseudoaleatorio] una muestra iid distribuido de f y de utilizar la aproximación I = 1(x1,,xn)fque

I^=1ni=1nH(xi)
  1. es un estimador imparcial de I
  2. converge casi seguro a I

Dependiendo de la elección de la distribución , el estimador anterior que puede o no tener una varianza finita. Sin embargo, siempre existen opciones de f que permiten una variación finita e incluso una variación arbitrariamente pequeña (aunque esas opciones pueden no estar disponibles en la práctica). Y también existen opciones de f que hacen que el estimador de muestreo de importancia que una muy mala aproximación de I . Esto incluye todas las opciones donde la varianza se vuelve infinita, a pesar de que un artículo reciente de Chatterjee y Diaconis estudia cómo comparar muestras de importancia con la varianza infinita. La siguiente imagen está tomada defI^ffI^IMi discusión en el blog del artículo ilustra la pobre convergencia de los estimadores de varianza infinita.

Muestreo de importancia con distribución importante una distribución Exp (1) distribución objetivo una distribución Exp (1/10), y función de interés $ h (x) = x $.  El verdadero valor de la integral es $ 10 $.

Muestreo de importancia con distribución importante una distribución Exp (1) distribución objetivo una distribución Exp (1/10), y función de interés . El verdadero valor de la integral es 10 .h(x)=x10

[Lo siguiente se reproduce de nuestro libro Métodos estadísticos de Monte Carlo .]

f

Xh(x)f(x)dx

pC(0,1)2

p=2+1π(1+x2)dx.
p
p^1=1mj=1mIXj>2
X1,,Xm C(0,1)p(1p)/m0.127/mp=0.15

C(0,1)

p^2=12mj=1mI|Xj|>2
p(12p)/2m0.052/m

[2,+)pp

p=12021π(1+x2)dx,
h(X)=2/π(1+X2)XU[0,2]p
p^3=121mj=1mh(Uj)
UjU[0,2]p^3(E[h2]E[h]2)/m0.0285/mp
p=01/2y2π(1+y2)dy,
14h(Y)=1/2π(1+Y2)[0,1/2]p
p^4=14mj=1mh(Yj)
YjU[0,1/2]p^40.95104/m

p^1p^4103100032p^1

Xi'an
fuente
55
Gracias @Xi 'an por tomarse la molestia de ilustrar el muestreo de importancia de una manera que todos puedan apreciar y creo que satisface más que la solicitud de Bill Huber. +1
Michael R. Chernick
2
Quiero señalar que inicialmente esta publicación se suspendió y gracias a las contribuciones de varias personas. Hemos creado un hilo informativo.
Michael R. Chernick
55
Christian, quiero extender mi agradecimiento y expresar un sentimiento de privilegio de que estés compartiendo activamente este excelente material con nosotros.
whuber
44
Solo quiero agregar un agradecimiento a Xi'an, que tuvo la amabilidad de hacer algunas ediciones para mejorar mi respuesta a pesar de que dio una propia.
Michael R. Chernick
3
Esta tiene que ser una de las mejores publicaciones en stats.stackexchange. ¡Gracias por compartir!
dohmatob