El artículo The Odds, continuamente actualizado menciona la historia de un pescador de Long Island que literalmente debe su vida a las estadísticas bayesianas. Aquí está la versión corta:
Hay dos pescadores en un bote en medio de la noche. Mientras uno está dormido, el otro cae al océano. El bote continúa navegando en piloto automático durante toda la noche hasta que el primer hombre finalmente se despierta y notifica a la Guardia Costera. La Guardia Costera utiliza un software llamado SAROPS (Sistema de Planificación Óptima de Búsqueda y Rescate) para encontrarlo justo a tiempo, ya que estaba hipotérmico y casi sin energía para mantenerse a flote.
Aquí está la versión larga: A Speck In The Sea
Quería saber más sobre cómo el Teorema de Bayes se aplica realmente aquí. Descubrí bastante sobre el software SAROPS simplemente buscando en Google.
El simulador de SAROPS
El componente del simulador tiene en cuenta datos oportunos como la corriente oceánica, el viento, etc. y simula miles de posibles rutas de deriva. A partir de esos caminos de deriva, se crea un mapa de distribución de probabilidad.
Tenga en cuenta que los siguientes gráficos no se refieren al caso del pescador desaparecido que mencioné anteriormente, pero son un ejemplo de juguete tomado de esta presentación
Mapa de probabilidad 1 (el rojo indica la probabilidad más alta; el azul, la más baja)
Tenga en cuenta el círculo que es la ubicación inicial.
Mapa de probabilidad 2 : ha pasado más tiempo
Tenga en cuenta que el mapa de probabilidad se ha convertido en multimodal. Esto se debe a que en este ejemplo, se tienen en cuenta múltiples escenarios:
- La persona está flotando en el agua - modo superior-medio
- La persona está en una balsa salvavidas (más afectada por el viento del norte) - modos 2 inferiores (divididos debido a "efectos de vibración")
Mapa de probabilidad 3 : la búsqueda se realizó a lo largo de las rutas rectangulares en rojo Esta imagen muestra las rutas óptimas producidas por el planificador (otro componente de SAROPS). Como puede ver, se buscaron esas rutas y el simulador actualizó el mapa de probabilidad.
Tal vez se pregunte por qué las áreas que se han buscado no se han reducido a una probabilidad cero. Eso es porque hay una probabilidad de falla, , factorizada, es decir, hay una posibilidad no despreciable de que el buscador pase por alto a la persona en el agua. Es comprensible que la probabilidad de falla sea mucho mayor para una persona solitaria a flote que para una persona en una balsa salvavidas (más fácil de ver), por lo que las probabilidades en el área superior no disminuyeron demasiado.
Efectos de una búsqueda fallida
Aquí es donde entra en juego el Teorema de Bayes. Una vez que se realiza una búsqueda, el mapa de probabilidad se actualiza en consecuencia para que otra búsqueda se pueda planificar de manera óptima.
Después de revisar el Teorema de Bayes en Wikipedia y en el artículo Una explicación intuitiva (y breve) del Teorema de Bayes en BetterExplained.com
Tomé la ecuación de Bayes:
Y definió A y X de la siguiente manera ...
Evento A: la persona está en esta área (celda de cuadrícula)
Prueba X: búsqueda fallida en esa área (celda de cuadrícula), es decir, busqué esa área y no vi nada
Flexible,
En el Sistema de Planificación Óptima de Búsqueda y Rescate descubrí que SAROPS calcula la probabilidad de una búsqueda fallida, , teniendo en cuenta las rutas de búsqueda y las rutas de deriva simuladas. Entonces, por simplicidad, supongamos que sabemos cuál es el valor de .
Entonces ahora tenemos,
¿La ecuación de Bayes se aplica correctamente aquí?
¿Cómo se calcularía el denominador, la probabilidad de una búsqueda fallida?
También en el sistema de planificación óptima de búsqueda y rescate , dicen
Las probabilidades previas se "normalizan en la forma bayesiana habitual" para producir las probabilidades posteriores
¿Qué significa "normalizado en la forma bayesiana normal" ?
¿Significa que todas las probabilidades se dividen por , o simplemente se normalizan para garantizar que todo el mapa de probabilidad se sume a uno? ¿O son estos uno y lo mismo?
Por último, ¿cuál sería la forma correcta de normalizar el mapa de probabilidad cuadriculado después de haber actualizado para una búsqueda fallida, teniendo en cuenta que dado que no ha buscado TODAS las áreas (celdas de la cuadrícula) tendría algunas celdas iguales a y algunos iguales a ?
Otra nota de simplificación: de acuerdo con el Sistema de Planificación Óptima de Búsqueda y Rescate, la distribución posterior se calcula realmente actualizando las probabilidades de las rutas de deriva simuladas y ENTONCES volviendo a generar el mapa de probabilidad cuadriculado. Para mantener este ejemplo lo suficientemente simple, elegí ignorar las rutas de simulación y centrarme en las celdas de la cuadrícula.
Me señaló un libro que tiene un capítulo entero dedicado a mi pregunta, Análisis de operaciones navales , de un ex profesor que solía ser piloto de helicóptero y que en realidad realizó misiones de búsqueda y rescate, ¡nada menos!
En el capítulo 8 se proporciona un ejemplo similar a este (lo personalicé un poco):
Para empezar, hay una distribución previa cuadriculada para la ubicación de la (s) persona (s) desaparecida (s), barco, etc.
Distribución previa:
Se realiza una búsqueda en parte de la cuadrícula y las probabilidades se actualizan con una distribución posterior normalizada aplicando la ecuación de Bayes de la misma manera que mencioné en mis preguntas:
donde (i, j) = (lat, largo)
En este caso, decidí buscar la columna 3 porque esa columna tenía la mayor probabilidad previa total .
Distribución posterior normalizada después de buscar la tercera columna con pFail = 0.2:
Mi pregunta fue principalmente sobre cómo se normalizó la parte posterior. Así es como se hizo en el libro: simplemente divida cada probabilidad posterior individual por la suma total , S :
Elegí una probabilidad de 0.2 de una búsqueda fallida porque mi profesor dijo lo siguiente: "Solo buscamos una probabilidad de detección del 80% porque esa suele ser la mejor compensación entre timidez y precisión".
Solo por diversión, ejecuté otro ejemplo con un pFail de 0.5. Mientras que en el primer ejemplo ( pFail = 0.2), la siguiente mejor ruta de búsqueda (dada la búsqueda normalizada posterior y en línea recta, sin diagonal o zig-zag) sería volar sobre la columna 2, en el segundo ejemplo ( pFail = 0.5) la siguiente mejor ruta es sobre la fila 2.
Distribución posterior normalizada después de buscar la tercera columna con pFail = 0.5:
También agregó esto: "Las aeronaves llevan una pequeña lista de verificación con ellas para ayudar a determinar la mejor altitud y velocidad aérea. Trabajar esto en un helicóptero volador es como sentarse sobre una lavadora, leer un libro que está pegado a una lavadora diferente".
fuente