¿Cómo estimar la precisión de una integral?

11

Una situación extremadamente común en los gráficos de computadora es que el color de algunos píxeles es igual a la integral de alguna función de valor real. A menudo, la función es demasiado complicada para resolverla analíticamente, por lo que nos queda una aproximación numérica. Pero la función también suele ser muy costosa de calcular, por lo que estamos muy limitados en la cantidad de muestras que podemos calcular. (Por ejemplo, no puedes decidir tomar un millón de muestras y dejarlo así).

En general, entonces, lo que desea hacer es evaluar la función en puntos elegidos al azar hasta que la integral estimada sea "lo suficientemente precisa". Lo que me lleva a mi pregunta real: ¿cómo se estima la "precisión" de la integral?


Más específicamente, tenemos , que se implementa mediante un algoritmo informático lento y complicado. Queremos estimarf:RR

k=abf(x) dx

Podemos calcular para cualquier que deseemos, pero es costoso. Por lo tanto, queremos elegir varios valores de al azar y detenernos cuando la estimación de sea ​​aceptablemente precisa. Para hacer esto, por supuesto, necesitamos saber qué tan precisa es realmente la estimación actual.x x kf(x)xxk

Ni siquiera estoy seguro de qué herramientas estadísticas serían apropiadas para este tipo de problema. Pero me parece que si no sabemos absolutamente nada acerca de , entonces el problema no tiene solución. Por ejemplo, si calcula mil veces y siempre es cero, su integral estimada sería cero. Pero, sin saber nada sobre , todavía es posible que todas partes, excepto los puntos que tomaste como muestra, ¡por lo que tu estimación es terriblemente incorrecta!f ( x ) f f ( x ) = 1 , 000 , 000ff(x)ff(x)=1,000,000

Quizás, entonces, mi pregunta debería haber comenzado con "¿qué necesitamos saber sobre para hacer posible estimar la precisión de nuestra integralff ?" Por ejemplo, a menudo sabemos que es imposible que sea ​​negativo, lo que parece ser un hecho muy relevante ...f


Editar: OK, así que esto parece haber generado muchas respuestas, lo cual es bueno. En lugar de responder a cada uno de ellos individualmente, voy a tratar de completar algunos antecedentes adicionales aquí.

Cuando digo que no sabemos "nada" sobre , quiero decir que podemos calcular , pero no sabemos nada más al respecto. Esperaría (y los comentarios parecen estar de acuerdo) que tener más conocimiento nos permite usar mejores algoritmos. Parece que sería útil conocer los límites de y / o la primera derivada de .f f fffff

En la mayoría de los problemas en los que estoy pensando, cambia según la geometría de la escena y la ubicación dentro de la escena en consideración. No es una buena y ordenada pieza de álgebra que puedas resolver analíticamente. Típicamente representa la intensidad de la luz. Obviamente, la intensidad de la luz nunca puede ser negativa, pero no hay límite en cuanto a la magnitud de sus valores positivos. Y, por último, los bordes de los objetos suelen dar lugar a discontinuidades agudas en , y generalmente no se puede predecir dónde están.f ffff

En resumen, está condenadamente incómodo, así que mi primer puerto de escala fue preguntar qué podemos hacer con él sin más información. Parece que sin al menos algunos límites superiores e inferiores, la respuesta es "no mucho" ... Así que parece que necesito comenzar a hacer algunas suposiciones para avanzar aquí.f

Además, dada la cantidad de veces que ha surgido "Monte Carlo", ¿supongo que ese es el término técnico para este tipo de integración?

Orquídea matemática
fuente
Cuando dices "si no sabemos absolutamente nada acerca de ", ¿qué quieres decir exactamente? Podemos calcular , ¿verdad? fff
Macro
2
Normalmente, cuando integra sobre una función conocida, puede hacer mucho mejor que la integración de Monte Carlo. Monte Carlo converge al valor verdadero a una tasa de 1/N , donde es el número de puntos de evaluación. Otros algoritmos, por ejemplo, basados ​​en cuadratura, convergerán a una velocidad de 1 / N o incluso más rápido (por ejemplo, para una función que es periódica sobre la región de integración), suponiendo cierto nivel de suavidad de la función. Aún otros, basados ​​en secuencias cuasialeativas (por ejemplo, secuencias de Sobol '), convergerán a velocidades intermedias, por ejemplo, ( ln N ) n / N para una integración n- dimensional. N1/N(lnN)n/Nn
jbowman
1
Esto tiene respuestas claras pero poco gratificantes. La respuesta a la segunda pregunta es "nada": el único requisito es que sea ​​medible, lo que está implícito en pedir su integral. Pero lo único que puedes hacer es un muestreo aleatorio. Con supuestos adicionales, uno puede hacer mucho mejor al estimar la integral y evaluar la precisión. Entonces, una mejor pregunta es "qué mejoras en la estimación de precisión se pueden lograr con qué supuestos". Pero esto es demasiado amplio. Por lo tanto, díganos con qué tipo de funciones está trabajando actualmente. f
whuber
1
@Macro Ese procedimiento no es gratificante porque es lo peor que puedes hacer. Como señala jbowman, los supuestos muy leves sobre pueden conducir a estimaciones mucho mejores. Por cierto, no tiene sentido estipular que es "finito". Si es una función bien definida, todos sus valores son números reales y, a fortiori, finitos. Si quisiste decir "acotado", eso no sirve de nada a menos que conozcas los límites de antemano. fff
whuber
1
@Macro ¡La mayoría de las funciones no son continuas en ningún lado! De hecho, no veo cómo el CLT podría aplicarse en general. podría ser el CDF inverso de literalmente cualquier distribución, por ejemplo, en cuyo caso sus sorteos de Monte-Carlo están tomando muestras de esa distribución, para lo cual el CLT no necesita aplicarse incluso si la integral en sí (es decir, la media) existe. Creo que sería mucho más fructífero para el OP reducir la pregunta y los encuestados seguir las sugerencias de jbowman. f
whuber

Respuestas:

2

Por simplicidad, supongamos que f (x)> = 0 para todas las x en [a, b] y sabemos que M es tal que f (x) <M para todas las x en [a, b]. La integral I de f sobre [a, b] puede encerrarse en el rectángulo con ancho ba y altura M. La integral de f es la proporción del rectángulo que cae bajo la función f multiplicada por M (ba). Ahora, si elige puntos en el rectángulo al azar y cuenta el punto como un éxito si cae por debajo de la curva y como un fracaso, de lo contrario, ha configurado una prueba de Bernoulli. La fracción de muestra de puntos en el interior es una proporción binomial y, por lo tanto, tiene una media p y una varianza p (1-p) / n donde n es el número de puntos tomados. Por lo tanto, puede construir un intervalo de confianza para p y dado que I = p M (ba) un intervalo de confianza para I también dado que para la estimación I ^ = p ^ M (ba), Var (I ^) = M 2 (ba) 222p (1-p) / n. Entonces, para usar estadísticas para determinar el n más pequeño para el cual la integral es lo suficientemente precisa, podría especificar un límite superior S en la varianza de I ^. Nota p (1-p) / n <= 1 / (4n) por cada 0 <= p <= 1. Por lo tanto, configure S = M 2 (ba) 2 / (4n) o n = entero más pequeño> M 2 (ba) 2 / (4S).2222

Michael R. Chernick
fuente
3
Esto funcionaría bajo los supuestos que expuso en la primera oración, pero según la descripción del problema, parece poco probable que pueda, a priori , vincular los valores de la función entre y M0Mf
1
@Macro Sin saber nada acerca de f No veo cómo se podría decir algo sobre la precisión estadística de una estimación de la integral basada en evaluarla en un conjunto fijo de puntos finitos. Mis suposiciones son bastante mínimas. Si f está delimitado en el intervalo [a, b] debería haber algo de M lo suficientemente grande como para que pueda usarse como límite superior en f.
Michael R. Chernick
Ciertamente estoy de acuerdo con su primera oración, que comienza a abordar la segunda pregunta del OP. Pero, el método que ha descrito requiere que usted,M
2
Es una suposición. Usé el término mimimal para decir que estoy haciendo la menor cantidad de suposiciones posible para llegar a una respuesta definitiva.
Michael R. Chernick
Qué idea tan ingeniosa ... Tienes razón, no funciona sin límites en f , pero parece que no puedes hacer mucho sin esa información.
MathematicalOrchid
8

f

Una lectura complementaria a esto sería, por supuesto, la monografía de Niederreiter (1992) .

StasK
fuente
3
(+1) Josef Dick también tiene algunos resultados relacionados bastante recientes e interesantes.
Cardenal