Estoy tratando de aprender aprendizaje de refuerzo y este tema es realmente confuso para mí. He tomado una introducción a las estadísticas, pero no podía entender este tema intuitivamente.
fuente
Estoy tratando de aprender aprendizaje de refuerzo y este tema es realmente confuso para mí. He tomado una introducción a las estadísticas, pero no podía entender este tema intuitivamente.
El muestreo de importancia es una forma de muestreo de una distribución diferente de la distribución de interés para obtener más fácilmente mejores estimaciones de un parámetro de la distribución de interés. Normalmente, esto proporcionará estimaciones del parámetro con una varianza menor que la que se obtendría al tomar muestras directamente de la distribución original con el mismo tamaño de muestra.
Se aplica en varios contextos. En general, el muestreo de la distribución diferente permite tomar más muestras en una parte de la distribución de interés que dicta la aplicación (región importante).
Un ejemplo podría ser que desea tener una muestra que incluya más muestras de las colas de la distribución de lo que proporcionaría un muestreo aleatorio puro de la distribución de interés.
El artículo de Wikipedia que he visto sobre este tema es demasiado abstracto. Es mejor mirar varios ejemplos específicos. Sin embargo, sí incluye enlaces a aplicaciones interesantes como Bayesian Networks.
Un ejemplo de muestreo importante en las décadas de 1940 y 1950 es una técnica de reducción de varianza (una forma del Método Monte Carlo). Véase, por ejemplo, el libro Monte Carlo Methods de Hammersley y Handscomb publicado como Methuen Monograph / Chapman and Hall en 1964 y reimpreso en 1966 y más tarde por otros editores. La sección 5.4 del libro cubre el muestreo de importancia.
El muestreo de importancia es un método de simulación o Monte Carlo destinado a la aproximación de integrales. El término "muestreo" es algo confuso en el sentido de que no tiene la intención de proporcionar muestras de una distribución dada.
La intuición detrás del muestreo de importancia es que una integral bien definida, como puede expresarse como una expectativa para un amplio rango de distribuciones de probabilidad: I = E f [ H ( X ) ] = ∫ X H ( x ) f ( x )
Una vez que se comprende esta propiedad elemental, la implementación de la idea es confiar en la Ley de Números Grandes como en otros métodos de Monte Carlo, es decir, simular [a través de un generador pseudoaleatorio] una muestra iid distribuido de f y de utilizar la aproximación I = 1( x1, ... , xnorte) F que
Dependiendo de la elección de la distribución , el estimador anterior que puede o no tener una varianza finita. Sin embargo, siempre existen opciones de f que permiten una variación finita e incluso una variación arbitrariamente pequeña (aunque esas opciones pueden no estar disponibles en la práctica). Y también existen opciones de f que hacen que el estimador de muestreo de importancia que una muy mala aproximación de I . Esto incluye todas las opciones donde la varianza se vuelve infinita, a pesar de que un artículo reciente de Chatterjee y Diaconis estudia cómo comparar muestras de importancia con la varianza infinita. La siguiente imagen está tomada deF yo^ F F yo^ yo Mi discusión en el blog del artículo ilustra la pobre convergencia de los estimadores de varianza infinita.
[Lo siguiente se reproduce de nuestro libro Métodos estadísticos de Monte Carlo .]
fuente