Principales ventajas de los modelos de proceso gaussianos

11

El proceso gaussiano ha sido ampliamente utilizado, especialmente en la emulación. Se sabe que la demanda computacional es alta ( ).0(n3)

  1. ¿Qué los hace populares?
  2. ¿Cuáles son sus ventajas principales y ocultas?
  3. ¿Por qué se usan en lugar de modelos paramétricos (por modelo paramétrico me refiero a la regresión lineal típica en la que se pueden usar diferentes formas paramétricas para describir la tendencia de entrada vs salida; por ejemplo, qaudratic)?

Realmente agradecería una respuesta técnica que explique las propiedades inherentes que hacen que el proceso gaussiano sea único y ventajoso

Wis
fuente
¿Puedes aclarar qué quieres decir con modelos paramétricos?
Alexey Zaytsev
@Alexey He aclarado lo que quiero decir con el modelo paramétrico anterior. Gracias
Sab
Por lo que supongo sobre los modelos paramétricos, debe especificar el modelo a mano para cada problema. Esto no siempre es posible, ya que la verdadera naturaleza no siempre se conoce. Además, puede haber dificultades con el ajuste de estos modelos, mientras que para los procesos gaussianos la estimación de parámetros funciona bien casi siempre.
Alexey Zaytsev
44
Las splines y la regresión lineal son equivalentes a la regresión de procesos gaussianos con la función de covarianza adecuada seleccionada. Pero los procesos gaussianos proporcionan un marco probabilístico conveniente y adecuado para muchas tareas.
Alexey Zaytsev
1
¿Cuándo no utilizarías el proceso gaussiano?
Alby

Respuestas:

6

Las principales ventajas son desde el punto de vista de la ingeniería (como se menciona en @Alexey). En el procedimiento de Kriging ampliamente utilizado , puede interpretar su propio "espacio" proporcionando un modelo de "correlación" (o covarianza) (típicamente llamado elipsoide de variograma ) para las relaciones que dependen de la distancia y la orientación.

No hay nada que impida que otras metodologías tengan las mismas características, simplemente sucedió que la forma en que se conceptualizó por primera vez el kriging tenía un enfoque amigable con las personas que no eran estadísticos.

Hoy en día, con el surgimiento de metodologías estocásticas basadas en la geoestadística, como la simulación secuencial gaussiana, entre otros , estos procedimientos se están utilizando en sectores donde es importante definir el espacio de incertidumbre (que puede llevar de miles a millones de dimensiones). Nuevamente, desde el punto de vista de la ingeniería, los algoritmos basados ​​en geoestadística son muy fáciles de incluir en la programación genética . Por lo tanto, cuando tiene problemas inversos necesita poder probar múltiples escenarios y probar su adaptabilidad a su función de optimización.

Dejemos por un momento la pura argumentación y expongamos los hechos para un ejemplo real moderno de este uso. Puede tomar muestras subterráneas directamente (datos duros) o hacer un mapa sísmico del subsuelo (datos blandos).

En los datos duros, puede medir una propiedad (digamos impedancia acústica) directamente sin error (ish). El problema es que esto es escaso (y costoso). Por otro lado, tiene el mapeo sísmico que es literalmente un mapa de volumen, en forma de píxeles, del subsuelo pero que no le proporciona impedancia acústica. Para simplificar, digamos que le da la relación entre dos valores de impedancia acústica (superior e inferior). Por lo tanto, una relación de 0.5 podría ser una división de 1000/2000 o 10 000/20 000. Es un espacio de solución múltiple y varias combinaciones funcionarán, pero solo una representa con precisión la realidad. ¿Cómo resuelves esto?

La forma en que funciona la inversión sísmica (los procedimientos estocásticos) es produciendo escenarios plausibles (y esta es otra historia en conjunto) de impedancia acústica (u otras propiedades), transforma esos escenarios en una sísmica sintética (como la relación en el ejemplo anterior) y compara la sísmica sintética con la real (correlación). Los mejores escenarios se utilizarán para producir aún más escenarios, convergiendo en una solución (esto no es tan fácil como parece).

Teniendo esto en cuenta y hablando desde el punto de vista de la usabilidad, respondería sus preguntas de la siguiente manera:

1) Lo que los hace populares es la usabilidad, la flexibilidad en la implementación, una buena cantidad de centros e instituciones de investigación que siguen haciendo procedimientos gaussianos más nuevos y más adaptables para varios campos diferentes (particularmente en geociencias, SIG incluido).

2) Las principales ventajas son , como se mencionó anteriormente, usabilidad y flexibilidad desde mi punto de vista. Si es fácil de manipular y de usar, simplemente hazlo. No hay características particulares en los procesos gaussianos que no sean reproducibles en otras metodologías (estadísticas u otros).

3) Se utilizan cuando necesita incluir más información en su modelo que solo los datos (la información tiene relaciones espaciales, distribuciones estadísticas, etc.). Puedo asegurar que si tiene muchos datos con un comportamiento isotrópico, usar kriging es una pérdida de tiempo. Puede obtener los mismos resultados con cualquier otro método que al requerir menos información, es más rápido de ejecutar.

armada
fuente
¿Y cuándo es otro modelo una mejor opción?
Ben
1
@Ben Siempre dependerá del estudio de caso. Kriging, o los métodos basados ​​en Kriging, tienen un alto costo de cálculo (por lo tanto, no rápido). Por ejemplo, los televisores modernos de 4k (o más) usan métodos de interpolación para tratar de mejorar el contenido creado para resoluciones más pequeñas. Esto implica que necesita realizar esta operación rápidamente y sin intervención del usuario (lo que requeriría un modelo de covarianza). Si tuviera que resolver este problema en particular, evitaría Kriging por completo. Por otra parte algunos fenómenos se basa patrón, o tiene una variable discreta, o puede ser reducido a la fórmula (FEM, por ejemplo), etc ...
armatita
¿Y cuando la velocidad no es importante?
Ben
@Ben Speed ​​es menos importante si su resultado no necesita ser inmediato. El modelado subsuperficial, la predicción del clima y un montón de operaciones dentro de las ciencias SIG son solo algunos ejemplos. Otro es el que se presenta en la respuesta (inversión sísmica).
armatita
Lo siento, no entendí eso. No importa la velocidad computacional ni la de resultados, ¿cuáles son las desventajas de un médico de cabecera? O en otras palabras: ¿no debería usarse mucho más a menudo?
Ben
7

Para los ingenieros es importante:

  • tener intervalos de confianza para las predicciones
  • interpolar datos de entrenamiento
  • tener modelos lisos y no lineales
  • utilizar modelos de regresión obtenidos para el diseño adaptativo de experimentos y optimización

Los procesos gaussianos cumplen todos estos requisitos.

Además, a menudo los conjuntos de datos de ingeniería y geoestadística no son tan grandes o tienen una estructura de cuadrícula específica que permite una inferencia rápida.

Alexey Zaytsev
fuente
1
Gracias por tu comentario . Parece que debido a su interpretación bayesiana, los modelos de procesos gaussianos pueden tener una buena cuantificación de la incertidumbre, sin embargo, esto también es posible en la regresión paramétrica. Estoy buscando un enfoque técnico que pueda explicar el conjunto de ventajas estadísticas
Sab
3

Las ventajas del modelo gaussiano.

El PDF gaussiano solo depende de sus momentos de primer y segundo orden. Un proceso gaussiano estacionario de sentido amplio es también un proceso estacionario de sentido estricto y viceversa.

Los PDF gaussianos pueden modelar la distribución de muchos procesos, incluidas algunas clases importantes de señales y ruido. La suma de muchos procesos aleatorios independientes tiene una distribución gaussiana (teorema del límite central).

Los procesos no gaussianos se pueden aproximar mediante una combinación ponderada (es decir, una mezcla) de varios archivos PDF gaussianos de medias y variaciones apropiadas.

Los métodos de estimación óptimos basados ​​en modelos gaussianos a menudo resultan en soluciones lineales y matemáticamente manejables.

Wilson
fuente