Esta puede ser una pregunta elemental, por eso no he podido encontrarla en Stackexchange o Mathoverflow, sin embargo, estoy teniendo problemas con la aritmética involucrada en la actualización de probabilidades usando el teorema de Bayes para un problema en el que estoy trabajando.
Antecedentes:
Estoy tratando de dar pronósticos de probabilidad a eventos futuros que no tienen o tienen pocos precedentes. A diferencia de la mayoría de la literatura y los textos sobre Bayes que usan distribuciones previamente conocidas para dar probabilidades sobre eventos futuros dentro de parámetros similares, mi situación se basa en la opinión de expertos solo con pocas o ninguna distribución razonable de referencia.
Ejemplo:
GM anunció que están desarrollando un nuevo automóvil, pero no dijo cuándo se lanzaría. El Gerente de Producción de KIA necesita saber cuándo estarán listos para lanzarlo para poder lanzar su nuevo auto al mismo tiempo.
KIA sabe que el nuevo automóvil necesita los siguientes componentes para estar listo para el lanzamiento (1) motor, (2) transmisión, (3) cuerpo, (4) Ruedas y suspensión. Los experimentados ingenieros de KIA afirman que para un nuevo proyecto como este tienen un 90% de confianza en que se puede completar en dos años. KIA también descubrió que GM hizo una prueba con la nueva transmisión en otro SUV y funcionó según lo diseñado con una tasa de éxito del 95%. Los mismos ingenieros declararon que, dada esta prueba de transmisión, un automóvil puede completarse dentro de ese período de tiempo el 70% del tiempo.
A mi modo de ver, en este punto KIA puede comenzar el cálculo bayesiano con la muestra inicial de la siguiente manera:
A = GM will release the new car in two years
B1 = GM will successfully test a new transmission
P(A) = Prior Probability that GM will release the new car in two years
P(B1) = Probability that GM will successfully test a new transmission
P(B1|A) = Likelihood that given a successful transmission test, the car will be released within 2 years
Asignando valores de la siguiente manera
P(A) = .9
P(B1) = .95
P(B1|A) = .7
Poco después de que el departamento de estadísticas de KIA ofreciera esta actualización, GM anunció que habían probado su nuevo motor y que tenía una tasa de éxito del 98% en todas sus pruebas. Los ingenieros de KIA dijeron que, por lo general, si hay una prueba de motor exitosa, existe una probabilidad del 80% de que un automóvil se complete a tiempo, pero no sabían cuál era la probabilidad del tiempo de finalización general, tanto el motor como el motor. prueba de transmisión fue.
Los valores ahora para nuestra segunda evidencia, que deben tenerse en cuenta, son independientes para este caso, pero no en todos los casos, por ejemplo, el cuerpo debe continuar después de la suspensión:
P(B2) = .98
P(B2|A) = .8
Entonces, aquí es donde tengo problemas: integrar aritméticamente la P posterior (A | B1) en el cálculo de P (A | B1, B2), dado que las anteriores deben permanecer constantes. Como mencioné, algunos eventos dentro de { } son independientes, otros son condicionales.
He visto la entrada de wikipedia que describe la extensión de tres bahías de eventos:
Sin embargo, ¿qué pasa con una cuarta y quinta extensión?
La mayoría de los libros y recursos en línea que tengo no muestran los pasos para actualizar las publicaciones anteriores de ninguna manera que pueda discriminar. Podría ser que estoy demasiado alejado de mis días de cálculo de pregrado para interpretarlo, pero mi temor es que necesito tener una experiencia significativa en teoría de conjuntos y matemáticas de nivel de posgrado para hacer lo que parece ser un cálculo simple. Este intercambio es lo más cercano que pude encontrar e incluso no lo atraviesa. El hecho de que después de una semana de búsqueda no haya encontrado un tutorial básico sobre la mecánica de la actualizaciónEl teorema de Bayes (no importa en qué consiste el teorema de Bayes y cómo funciona; hay más que suficientes) más allá de la primera implementación, me hace pensar que no es un cálculo trivial. ¿Hay una manera directa de hacer esta actualización sin matemáticas de nivel de posgrado?
Nota: Soy consciente de la ironía relacionada con la dificultad inherente del "problema de actualización" WRT Bayes, ya que Yudkowski ha continuado con esto por algún tiempo. Estaba asumiendo, quizás incorrectamente, que aquellos que trabajaban en él estaban haciendo referencia a iteraciones mucho más complejas, sin embargo, soy consciente de que podría ser el caso con el que me estoy encontrando.
Hay muchas formas de extender este resultado. La forma general es que Hay muchas formas de escribir numerador y denominador. Sus formularios dan dos ejemplos (suponiendo que y son lo mismo). Por supuesto, para un problema dado, debe formular el LHS escribiendo el RHS en términos de cantidades que realmente conoce; Si eso puede hacerse para su problema particular, probablemente valga una pregunta más específica, en este sitio.
Cuando las variables ( ), etc. son continuas, el cálculo de la parte posterior se vuelve mucho más complicado, en la mayoría de los problemas, y se requieren técnicas de matemática / estadística de nivel de posgrado.A,B,C,D
fuente