Digamos que tenemos dos monedas sesgadas C1
y C2
ambas tienen diferentes probabilidades de girar la cabeza.
Lanzamos C1
n1
tiempos y obtenemos H1
cabezas, C2
n2
tiempos y obtenemos H2
cabezas. Y encontramos que la proporción de caras para una moneda es más alta que la otra.
¿Cuál es la probabilidad con la que podemos decir que una moneda es mejor que la otra? (mejor aquí significa mayor probabilidad real de girar la cabeza).
probability
bernoulli-distribution
Thirupathi Thangavel
fuente
fuente
Respuestas:
Es fácil calcular la probabilidad de hacer esa observación, dado el hecho de que las dos monedas son iguales. Esto puede hacerse mediante la prueba exacta de Fishers . Dadas estas observaciones
La probabilidad de observar estos números mientras las monedas son iguales dada la cantidad de intentos , y la cantidad total de esn1 n2 H1+H2 p(H1,H2|n1,n2,H1+H2)=(H1+H2)!(n1+n2−H1−H2)!n1!n2!H1!H2!(n1−H1)!(n2−H2)!(n1+n2)!.
Pero lo que está pidiendo es la probabilidad de que una moneda sea mejor. Dado que discutimos acerca de una creencia sobre cuán sesgadas están las monedas, tenemos que usar un enfoque bayesiano para calcular el resultado. Tenga en cuenta que en la inferencia bayesiana el término creencia se modela como probabilidad y los dos términos se usan indistintamente (s. Probabilidad bayesiana ). Llamamos a la probabilidad de que la moneda arroje . La distribución posterior después de la observación, para este está dada por teorema de Bayes : El función de densidad de probabilidad (pdf)i pi pi f(pi|Hi,ni)=f(Hi|pi,ni)f(pi)f(ni,Hi) f(Hi|pi,ni) está dada por la probabilidad Binomial, ya que los intentos individuales son experimentos de Bernoulli:
I Asumo El conocimiento previo sobre es que podría estar entre y con igual probabilidad, por lo tanto . Entonces el nominador es .f(Hi|pi,ni)=(niHi)pHii(1−pi)ni−Hi f(pi) pi 0 1 f(pi)=1 f(Hi|pi,ni)f(pi)=f(Hi|pi,ni)
Para calcular usamos el hecho de que la integral sobre un pdf tiene que ser uno . Entonces el denominador será un factor constante para lograr eso. Existe un pdf conocido que difiere del nominador solo por un factor constante, que es la distribución beta . Por lo tanto,f(ni,Hi) ∫10f(p|Hi,ni)dp=1 f(pi|Hi,ni)=1B(Hi+1,ni−Hi+1)pHii(1−pi)ni−Hi.
El pdf para el par de probabilidades de monedas independientes esf(p1,p2|H1,n1,H2,n2)=f(p1|H1,n1)f(p2|H2,n2).
Ahora necesitamos integrar esto en los casos en que para descubrir cómo es probable que la moneda sea mejor que la moneda :p1>p2 1 2 P(p1>p2)=∫10∫p‘10f(p‘1,p‘2|H1,n1,H2,n2)dp‘2dp‘1=∫10B(p‘1;H2+1,n2−H2+1)B(H2+1,n2−H2+1)f(p‘1|H1,n1)dp‘1
No puedo resolver esta última integral analíticamente, pero uno puede resolverla numéricamente con una computadora después de conectar los números. es la función beta y es la función beta incompleta. Tenga en cuenta que porque es una variable continua y nunca es exactamente lo mismo que .B(⋅,⋅) B(⋅;⋅,⋅) P(p1=p2)=0 p1 p2
Con respecto a la suposición anterior sobre y sus comentarios: Una buena alternativa para modelar muchos cree es usar una distribución beta . Esto llevaría a una probabilidad final De esa manera, uno podría modelar un fuerte sesgo hacia las monedas regulares por grandes pero iguales , . Sería equivalente a lanzar la moneda veces adicionales y recibir , por lo tanto, equivale a tener más datos. es la cantidad de lanzamientos que no tendríamos que hacerf(pi) Beta(ai+1,bi+1) P(p1>p2)=∫10B(p‘1;H2+1+a2,n2−H2+1+b2)B(H2+1+a2,n2−H2+1+b2)f(p‘1|H1+a1,n1+a1+b1)dp‘1. ai bi ai+bi ai ai+bi si incluimos esto antes.
El OP declaró que las dos monedas están sesgadas en un grado desconocido. Entonces entendí que todo el conocimiento tiene que inferirse de las observaciones. Es por eso que opté por un poco informativo antes de que la dosis no sesgue el resultado, por ejemplo, hacia las monedas normales.
Toda la información se puede transmitir en forma de por moneda. La falta de un previo informativo solo significa que se necesitan más observaciones para decidir qué moneda es mejor con alta probabilidad.(Hi,ni)
Aquí está el código en R que proporciona una función usando el uniforme anterior :=P(p1>p2) f(pi)=1
P(n1, H1, n2, H2)
Puede dibujar para diferentes resultados experimentales y , , ejemplo, con este código franqueado:P(p1>p2) n1 n2 n1=n2=4
Es posible que necesite
install.packages("lattice")
primero.Se puede ver que, incluso con el uniforme anterior y un tamaño de muestra pequeño, la probabilidad o creer que una moneda es mejor puede volverse bastante sólida, cuando y difieren lo suficiente. Se necesita una diferencia relativa aún menor si y son aún mayores. Aquí hay una gráfica para y :H1 H2 n1 n2 n1=100 n2=200
Martijn Weterings sugirió calcular la distribución de probabilidad posterior para la diferencia entre y . Esto se puede hacer integrando el pdf del par sobre el conjunto :p1 p2 S(d)={(p1,p2)∈[0,1]2|d=|p1−p2|} f(d|H1,n1,H2,n2)=∫S(d)f(p1,p2|H1,n1,H2,n2)dγ=∫1−d0f(p,p+d|H1,n1,H2,n2)dp+∫1df(p,p−d|H1,n1,H2,n2)dp
De nuevo, no es una integral que pueda resolver analíticamente, pero el código R sería:
He trazado para , , y todos los valores de :f(d|n1,H1,n2,H2) n1=4 H1=3 n2=4 H2
Puede calcular la probabilidad deestar por encima de un valor por . Tenga en cuenta que la doble aplicación de la integral numérica viene con algún error numérico. Por ejemplo , siempre debe ser igual a ya que siempre toma un valor entre y . Pero el resultado a menudo se desvía ligeramente.|p1−p2| d 1 d 0 1
integrate(fd, d, 1, n1, H1, n2, H2)
integrate(fd, 0, 1, n1, H1, n2, H2)
fuente
He hecho una simulación numérica con
R
, probablemente estás buscando una respuesta analítica, pero pensé que esto podría ser interesante para compartir.En este primer código, simplemente simulo dos lanzamientos de monedas. Aquí puede ver, por supuesto, que
theta1 > theta2
, entonces, por supuesto, la frecuencia deH1
será mayor queH2
. Tenga en cuenta el diferenteN1
,N2
tamaños.Veamos qué podemos hacer con diferentes
thetas
. Tenga en cuenta que el código no es óptimo. En absoluto.Entonces, 0.93 es la frecuencia de veces (de un 100) que la primera moneda tenía más caras. Esto parece estar bien, mirando
theta1
ytheta2
usado.Veamos con dos vectores de
thetas
.Recuerde que
res_v
son las frecuencias dondeH1 > H2
, de 100 simulaciones.Entonces, a medida que
theta1
aumenta, la probabilidad deH1
ser mayor aumenta, por supuesto.He hecho algunas otras simulaciones y parece que los tamaños
N1
,N2
son menos importantes.Si está familiarizado
R
, puede usar este código para arrojar algo de luz sobre el problema. Soy consciente de que este no es un análisis completo, y se puede mejorar.fuente
res_v
cambia continuamente cuando las thetas se encuentran. Entendí la pregunta, ya que se trataba del sesgo intrínseco de las monedas después de hacer una sola observación. Parece responder a las observaciones que uno haría después de conocer el sesgo.