Integración Monte Carlo para funciones integrables no cuadradas

9

Espero que este sea el lugar correcto para preguntar, si no es así, siéntase libre de moverlo a un foro más apropiado.

Hace tiempo que me pregunto cómo tratar las funciones integrables no cuadradas con la integración de Monte Carlo. Sé que MC todavía da una estimación adecuada, pero el error es irrealizable (¿divergente?) Para ese tipo de funciones.

Restringámonos a una dimensión. La integración de Monte Carlo significa que aproximamos la integral

I=01dxf(x)

usando la estimación

E=1Ni=1Nf(xi)

con puntos aleatorios distribuidos uniformemente. La ley de los grandes números asegura que .La varianza muestraE Ixi[0,1]EI

S2=1N1i=1N(f(xi)E)2

aproxima la varianza de la distribución inducida por . Sin embargo, si no es integrable al cuadrado, es decir, la integral de la función al cuadrado diverge, esto implica f fσ2ff

σ2=01dx(f(x)I)2=01dxf2(x)I2

lo que significa que también la varianza diverge.

Un ejemplo simple es la función

f(x)=1x

para el cual y .σ2=10dxI=01dx1x=2σ2=01dx(1x2)=[lnx2x]01

Si es finito, se puede aproximar el error de la media por , pero qué si no es integrable al cuadrado? E Sσ2E f(x)SNσNf(x)

cschwan
fuente
1
No lo entiendo: comienzas notando que ninguno de los tiene una varianza y luego preguntas si la varianza de su promedio sería un estimador razonable de esa varianza inexistente. ¿O interpreto mal esta pregunta: quizás mediante "estimaciones estadísticamente independientes" tenga en mente un estimador diferente (quizás robusto) de la integral? Ei
whuber
No dije que no tiene una varianza, solo que no puedo definir una varianza para ella por . Así que la pregunta es si puedo definir un error en absoluto y si es un candidato razonable. Por estadísticamente independiente quiero decir que las se obtienen usando diferentes números aleatorios, por ejemplo, usando generadores de números aleatorios con semillas diferentes (espero que ese sea el término correcto entonces). S 2 ˉ S 2 E iES2S¯2Ei
cschwan
Explique a qué se refiere al no ser capaz de "definir una variación para ello por " No puedo entender esto usando las definiciones estándar de varianza y . S 2S2S2
whuber
Bueno, la función no es integrable al cuadrado, por lo tanto, si no me equivoco, debería divergir . Si este es el caso, la definición de no tiene sentido en primer lugar, ¿verdad? Sin embargo, mediante el teorema del límite central, seguirá convergiendo con el valor verdadero de la integral, pero sin un error este valor por sí solo no tiene sentido (¿qué tan 'bueno' es este resultado?). S 2 ES2S2E
cschwan
Lo siento, quería decir "ley de grandes números", por supuesto, no CLT.
cschwan

Respuestas:

2

Podría usar otras medidas de escala / dispersión, como el rango interquantil, que no se ven afectadas por los asintóticos de la cola y, por lo tanto, la integrabilidad cuadrada. Con el beneficio adicional de que a menudo son en general más robustos de todos modos.

Obviamente, uno los aplicará a un remuestreo / bootstrap seguido por el estimador medio, no directamente a la salida bruta del muestreo de MC de la función antes del promedio. También puede verificar en general los estimadores L y adaptar uno de ellos para combinar estos dos pasos en uno para el rendimiento, pero mentalmente las dos distribuciones no deben confundirse, aunque el estimador PDF heredará naturalmente algunas características (incluida la falta de cuadrados) integrabilidad).

Cuarzo
fuente
+1, debo agregar que la ley de los grandes números no requiere segundos momentos, por lo que este es un buen consejo.
mpiktas 01 de
¡Gracias por tu respuesta! Tengo que admitir que leí esos términos por primera vez, pero al buscarlos en WP creo que su respuesta me señala en la dirección correcta. ¿Podría usted u otra persona sugerir algunos artículos o libros que expliquen los temas con más detalle?
cschwan 01 de
Ahora me doy cuenta de que tal vez mi respuesta fue un poco confusa. Como está simulando, realmente no necesita remuestreo / arranque, en teoría podría simplemente agregar más muestras nuevas y obtener una distribución empírica para el estimador medio. Solo si los recursos son una preocupación, puede calcular previamente los promedios parciales y volver a muestrearlos, pero las estadísticas no serán triviales si se hacen bien. No soy un experto boostrap, así que dejaré consejos sobre eso a otros, solo quería señalarlo si necesita ir más allá de la formulación directa. Concéntrese en las medidas de dispersión primero, optimice después.
Quartz
El estimador medio propuesto no tiene una varianza finita. No importa si se agregan más muestras, la distribución empírica del estimador TAMBIÉN tendrá una varianza no finita. Puede confirmar esto con algunas simulaciones.
rajb245
1
Claro, de hecho, eso es lo que se estaba discutiendo y la razón por la cual se usará otra medida de dispersión.
Quartz