Los modelos de monedas sesgadas generalmente tienen un parámetro . Una forma de estimar partir de una serie de sorteos es usar una distribución beta anterior y calcular la distribución posterior con probabilidad binomial.θ
En mi configuración, debido a algún proceso físico extraño, mis propiedades de monedas cambian lentamente y convierte en una función del tiempo . Mis datos son un conjunto de dibujos ordenados, es decir, . Puedo considerar que solo tengo un sorteo por cada en una cuadrícula de tiempo discreta y regular.
¿Cómo modelarías esto? Estoy pensando en algo así como un filtro de Kalman adaptado al hecho de que la variable oculta es y que mantiene la probabilidad binomial. ¿Qué podría usar para modelar para mantener la inferencia manejable?
Edite las siguientes respuestas (¡gracias!) : Me gustaría modelar como una Cadena de Markov de orden 1 como se hace en filtros HMM o Kalman. La única suposición que puedo hacer es que es suave. Podría escribir con un pequeño ruido gaussiano (idea de filtro de Kalman), pero esto rompería el requisito de que debe permanecer en . Siguiendo la idea de @J Dav, podría usar una función probit para mapear la línea real a , pero tengo la intuición de que esto daría una solución no analítica. Una distribución beta con media y una variación más amplia podría hacer el truco.
Estoy haciendo esta pregunta ya que tengo la sensación de que este problema es tan simple que debe haber sido estudiado antes.
fuente
Respuestas:
Dudo que pueda llegar a un modelo con solución analítica, pero la inferencia aún puede hacerse manejable utilizando las herramientas adecuadas, ya que la estructura de dependencia de su modelo es simple. Como investigador de aprendizaje automático, preferiría usar el siguiente modelo ya que la inferencia se puede hacer bastante eficiente usando la técnica de Propagación de expectativas:
Deje ser el resultado del ensayo -ésimo. Definamos el parámetro que varía con el tiempotX(t) t
t ≥ 0η(t+1)∼N(η(t),τ2) para .t≥0
Para vincular con , introduzca variables latentesη(t) X(t)
y modelo para serX(t)
Si está interesado en implementar el algoritmo de inferencia, eche un vistazo a este documento . Utilizan un modelo muy similar para que pueda adaptar fácilmente el algoritmo. Para entender EP, la siguiente página puede resultarle útil. Si está interesado en seguir este enfoque, hágamelo saber; Puedo proporcionar consejos más detallados sobre cómo implementar el algoritmo de inferencia.
fuente
Para elaborar en mi comentario, un modelo como p (t) = p exp (-t) es un modelo simple y permite la estimación de p (t) estimando p usando la estimación de máxima verosimilitud. Pero, ¿la probabilidad realmente decae exponencialmente? Este modelo sería claramente incorrecto si observa períodos de tiempo con una alta frecuencia de éxito de lo que observó en épocas anteriores y posteriores. El comportamiento oscilatorio podría modelarse como p (t) = p | sint |. Ambos modelos son muy manejables y se pueden resolver con la máxima probabilidad, pero ofrecen soluciones muy diferentes.0 0 0
fuente
Para responder a su pregunta reeditada :
Como dijiste, usar probit implicaría solo soluciones numéricas, pero puedes usar una función logística en su lugar:
fuente