El proceso gaussiano ha sido ampliamente utilizado, especialmente en la emulación. Se sabe que la demanda computacional es alta ( ).
- ¿Qué los hace populares?
- ¿Cuáles son sus ventajas principales y ocultas?
- ¿Por qué se usan en lugar de modelos paramétricos (por modelo paramétrico me refiero a la regresión lineal típica en la que se pueden usar diferentes formas paramétricas para describir la tendencia de entrada vs salida; por ejemplo, qaudratic)?
Realmente agradecería una respuesta técnica que explique las propiedades inherentes que hacen que el proceso gaussiano sea único y ventajoso
Respuestas:
Las principales ventajas son desde el punto de vista de la ingeniería (como se menciona en @Alexey). En el procedimiento de Kriging ampliamente utilizado , puede interpretar su propio "espacio" proporcionando un modelo de "correlación" (o covarianza) (típicamente llamado elipsoide de variograma ) para las relaciones que dependen de la distancia y la orientación.
No hay nada que impida que otras metodologías tengan las mismas características, simplemente sucedió que la forma en que se conceptualizó por primera vez el kriging tenía un enfoque amigable con las personas que no eran estadísticos.
Hoy en día, con el surgimiento de metodologías estocásticas basadas en la geoestadística, como la simulación secuencial gaussiana, entre otros , estos procedimientos se están utilizando en sectores donde es importante definir el espacio de incertidumbre (que puede llevar de miles a millones de dimensiones). Nuevamente, desde el punto de vista de la ingeniería, los algoritmos basados en geoestadística son muy fáciles de incluir en la programación genética . Por lo tanto, cuando tiene problemas inversos necesita poder probar múltiples escenarios y probar su adaptabilidad a su función de optimización.
Dejemos por un momento la pura argumentación y expongamos los hechos para un ejemplo real moderno de este uso. Puede tomar muestras subterráneas directamente (datos duros) o hacer un mapa sísmico del subsuelo (datos blandos).
En los datos duros, puede medir una propiedad (digamos impedancia acústica) directamente sin error (ish). El problema es que esto es escaso (y costoso). Por otro lado, tiene el mapeo sísmico que es literalmente un mapa de volumen, en forma de píxeles, del subsuelo pero que no le proporciona impedancia acústica. Para simplificar, digamos que le da la relación entre dos valores de impedancia acústica (superior e inferior). Por lo tanto, una relación de 0.5 podría ser una división de 1000/2000 o 10 000/20 000. Es un espacio de solución múltiple y varias combinaciones funcionarán, pero solo una representa con precisión la realidad. ¿Cómo resuelves esto?
La forma en que funciona la inversión sísmica (los procedimientos estocásticos) es produciendo escenarios plausibles (y esta es otra historia en conjunto) de impedancia acústica (u otras propiedades), transforma esos escenarios en una sísmica sintética (como la relación en el ejemplo anterior) y compara la sísmica sintética con la real (correlación). Los mejores escenarios se utilizarán para producir aún más escenarios, convergiendo en una solución (esto no es tan fácil como parece).
Teniendo esto en cuenta y hablando desde el punto de vista de la usabilidad, respondería sus preguntas de la siguiente manera:
1) Lo que los hace populares es la usabilidad, la flexibilidad en la implementación, una buena cantidad de centros e instituciones de investigación que siguen haciendo procedimientos gaussianos más nuevos y más adaptables para varios campos diferentes (particularmente en geociencias, SIG incluido).
2) Las principales ventajas son , como se mencionó anteriormente, usabilidad y flexibilidad desde mi punto de vista. Si es fácil de manipular y de usar, simplemente hazlo. No hay características particulares en los procesos gaussianos que no sean reproducibles en otras metodologías (estadísticas u otros).
3) Se utilizan cuando necesita incluir más información en su modelo que solo los datos (la información tiene relaciones espaciales, distribuciones estadísticas, etc.). Puedo asegurar que si tiene muchos datos con un comportamiento isotrópico, usar kriging es una pérdida de tiempo. Puede obtener los mismos resultados con cualquier otro método que al requerir menos información, es más rápido de ejecutar.
fuente
Para los ingenieros es importante:
Los procesos gaussianos cumplen todos estos requisitos.
Además, a menudo los conjuntos de datos de ingeniería y geoestadística no son tan grandes o tienen una estructura de cuadrícula específica que permite una inferencia rápida.
fuente
Las ventajas del modelo gaussiano.
El PDF gaussiano solo depende de sus momentos de primer y segundo orden. Un proceso gaussiano estacionario de sentido amplio es también un proceso estacionario de sentido estricto y viceversa.
Los PDF gaussianos pueden modelar la distribución de muchos procesos, incluidas algunas clases importantes de señales y ruido. La suma de muchos procesos aleatorios independientes tiene una distribución gaussiana (teorema del límite central).
Los procesos no gaussianos se pueden aproximar mediante una combinación ponderada (es decir, una mezcla) de varios archivos PDF gaussianos de medias y variaciones apropiadas.
Los métodos de estimación óptimos basados en modelos gaussianos a menudo resultan en soluciones lineales y matemáticamente manejables.
fuente