Análisis de incertidumbre y sensibilidad.

8

Tengo el siguiente problema:

Dadas las entradas ( -vector dimensional) de escalares, enteros ordenados y enteros no ordenados (es decir, etiquetas) y una o varias salidas , me gustaría estimar:Xnortey

  1. Qué entradas explican mejor las salidas.
  2. Hasta qué punto las variaciones de una entrada implican variaciones de las salidas.

Se supone que esto está relacionado con el análisis de incertidumbre y sensibilidad, que son campos bastante amplios. ¿Conoces algún método / recurso con un enfoque relacionado con mi problema?

Flavio
fuente
En la pregunta quiere decir "sensibilidad", no "sensibilidad".
Michael R. Chernick
2
Saltelli ha escrito un texto útil y muchos artículos sobre análisis de sensibilidad.
David LeBauer

Respuestas:

18

Puede probar una de las herramientas proporcionadas aquí . Es decir, soluciones matlab, código muy agradable y métodos modernos. En primer lugar, le sugiero que pruebe las herramientas gráficas de la biblioteca para tener sentido sobre los datos.

Como no proporcionó los detalles sobre lo que necesita aquí, hay algunos comentarios sobre los métodos implicados:

Análisis de sensibilidad global . El análisis de sensibilidad global es el estudio de cómo la incertidumbre en la salida de un modelo (numérico o de otro tipo) se puede distribuir a diferentes fuentes de incertidumbre en la entrada del modelo. Global podría ser una especificación innecesaria aquí, si no fuera por el hecho de que la mayoría de los análisis encontrados en la literatura son locales o un factor a la vez.

Análisis Monte-Carlo (o basado en muestras) . El análisis de Monte Carlo (MC) se basa en realizar múltiples evaluaciones con una entrada de modelo seleccionada al azar, y luego usar los resultados de estas evaluaciones para determinar tanto la incertidumbre en las predicciones del modelo como la distribución a los factores de entrada de su contribución a esta incertidumbre. Un análisis de MC implica la selección de rangos y distribuciones para cada factor de entrada; generación de una muestra a partir de los rangos y distribuciones especificados en el primer paso; evaluación del modelo para cada elemento de la muestra; Análisis de incertidumbre y análisis de sensibilidad.

Metodología de superficie de respuesta . Este procedimiento se basa en el desarrollo de una aproximación de la superficie de respuesta al modelo en consideración. Esta aproximación luego se utiliza como un sustituto del modelo original en el análisis de incertidumbre y sensibilidad. El análisis implica la selección de rangos y distribuciones para cada factor de entrada, el desarrollo de un diseño experimental que define las combinaciones de valores de factores en los que se evalúa el modelo, las evaluaciones del modelo, la construcción de una aproximación de la superficie de respuesta al modelo original, el análisis de incertidumbre y análisis de sensibilidad.

Diseños de cribado . La detección de factores puede ser útil como primer paso cuando se trata de un modelo que contiene una gran cantidad de factores de entrada (cientos). Por factor de entrada nos referimos a cualquier cantidad que se pueda cambiar en el modelo antes de su ejecución. Esto puede ser un parámetro modelo, o una variable de entrada, o un escenario modelo. A menudo, solo unos pocos factores de entrada y agrupaciones de factores tienen un efecto significativo en la salida del modelo.

Local (Análisis diferencial) . Local SA investiga el impacto de los factores de entrada en el modelo localmente, es decir, en algún punto fijo en el espacio de los factores de entrada. La SA local generalmente se lleva a cabo calculando derivadas parciales de las funciones de salida con respecto a las variables de entrada (análisis diferencial). Para calcular la derivada numéricamente, los parámetros de entrada varían dentro de un pequeño intervalo alrededor de un valor nominal. El intervalo no está relacionado con nuestro grado de conocimiento de las variables y generalmente es el mismo para todas las variables.

FORM-SORM . FORM y SORM son métodos útiles cuando el analista no está interesado en la magnitud de Y (y, por lo tanto, en su variación potencial) sino en la probabilidad de que Y exceda algún valor crítico. La restricción (Y-Ycrit <0) determina una hiper-superficie en el espacio de los factores de entrada, X. La distancia mínima entre algún punto de diseño para X y la hiper-superficie es la cantidad de interés.

¡Buena suerte!

Pablo
fuente
Lamentablemente, el enlace que figura en esta respuesta "aquí" ya no funciona.
Nizar
2

Para abordar la primera pregunta, le sugiero que eche un vistazo al análisis de correlación canónica y a una técnica de reducción de dimensión más reciente llamada regresión inversa en rodajas . Sobre este último, ver el artículo inicial de Ker Chau Li

Regresión inversa en rodajas para la reducción de dimensiones (con discusión). Revista de la Asociación Americana de Estadística, 86 (414): 316–327, 1991.

Está disponible gratuitamente en Internet. La versión con los comentarios (interesantes) que podría tener que comprar pensó.

Algunos parámetros importantes para la elección de un método en su situación son:

  • dimensionalidad de la entrada (n = 3, n = 15 yn = 50 son problemas muy diferentes);
  • tiempo necesario para obtener una evaluación (0.1 s, 5 min y 5 horas también son problemas muy diferentes);
  • supuestos que puede hacer sobre su modelo: ¿es lineal? ¿Es monótono?

También menciona una posible salida multivariada. Si tiene algunos de ellos que representan cosas completamente diferentes, solo haga varios análisis de sensibilidad independientes.

Si están altamente correlacionados o son funcionales, también cambian mucho la problemática.

Debe aclarar todos estos puntos antes de optar por una metodología determinada.

M. Toya
fuente
2

Es posible que pueda utilizar un enfoque de análisis de sensibilidad global basado en la varianza para responder la segunda pregunta. Según Saltelli (2008) , el análisis de sensibilidad es

"... el estudio de cómo la incertidumbre en la salida de un modelo se puede distribuir a diferentes fuentes de incertidumbre en la entrada del modelo ..."

Los enfoques, como los mencionados en el libro de Saltelli, normalmente se centran en generar primero una muestra de entrada, que luego se ejecuta a través de un modelo para generar salidas, y luego se analiza. Las métricas de salida que resultan, como el índice de sensibilidad totalStyo e índice de sensibilidad de primer orden Syorepresentan la contribución del efecto principal de cada factor de entrada a la varianza de la salida. Los enfoques basados ​​en la varianza descomponen la varianza en la salida. Son computacionalmente exigentes y requieren una muestra de entrada específica.

Para sus propósitos, dado que tiene un rancho de datos existente, es un método alternativo como el sugerido por Delta Moment-Independent Measure (Borgonovo 2007, Plischke et al. 2013) e implementado en la biblioteca SALib de Python .

El siguiente código, tomado del ejemplo, le permite generar los índices de sensibilidad de sus datos existentes:

from SALib.analyze import dgsm
from SALib.util import read_param_file

# Read the parameter range file
problem = read_param_file('../../SALib/test_functions/params/Ishigami.txt')

# Perform the sensitivity analysis using the model output
# Specify which column of the output file to analyze (zero-indexed)
Si = dgsm.analyze(problem, param_values, Y, conf_level=0.95,     print_to_console=False)
# Returns a dictionary with keys 'vi', 'vi_std', 'dgsm', and 'dgsm_conf'
# e.g. Si['vi'] contains the sensitivity measure for each parameter, in
# the same order as the parameter file
willu47
fuente