Pensé en este problema en la ducha, estaba inspirado en las estrategias de inversión.
Digamos que había un árbol de dinero mágico. Todos los días, puede ofrecer una cantidad de dinero al árbol de dinero y lo triplicará o lo destruirá con una probabilidad de 50/50. Inmediatamente nota que, en promedio, ganará dinero al hacer esto y está ansioso por aprovechar el árbol del dinero. Sin embargo, si ofreciera todo su dinero a la vez, tendría un 50% de perder todo su dinero. ¡Inaceptable! Eres una persona bastante reacia al riesgo, así que decides idear una estrategia. Desea minimizar las probabilidades de perderlo todo, ¡pero también desea ganar tanto dinero como pueda! Se le ocurre lo siguiente: todos los días, ofrece el 20% de su capital actual al árbol del dinero. Suponiendo que lo más bajo que puede ofrecer es 1 centavo, se necesitaría una racha de 31 pérdidas para perder todo su dinero si comenzara con 10 dólares. Y lo que es más, cuanto más efectivo ganes, más tiempo tendrá que ser la racha perdedora para que puedas perder todo, ¡increíble! Rápidamente comienza a ganar mucho dinero en efectivo. Pero entonces se te ocurre una idea: ¡puedes ofrecer el 30% cada día y ganar mucho más dinero! Pero espera, ¿por qué no ofrecer el 35%? 50%? Un día, con grandes signos de dólar en tus ojos, corres hacia el árbol del dinero con todos tus millones y ofreces hasta el 100% de tu efectivo, que el árbol del dinero quema rápidamente. Al día siguiente, obtienes un trabajo en McDonalds. que el árbol del dinero quema rápidamente. Al día siguiente, obtienes un trabajo en McDonalds. que el árbol del dinero quema rápidamente. Al día siguiente, obtienes un trabajo en McDonalds.
¿Existe un porcentaje óptimo de su efectivo que pueda ofrecer sin perderlo todo?
(sub-preguntas:
Si hay un porcentaje óptimo que debe ofrecer, ¿es estático (es decir, 20% todos los días) o el porcentaje debería crecer a medida que aumenta su capital?
Al ofrecer un 20% todos los días, ¿las probabilidades de perder todo su dinero disminuyen o aumentan con el tiempo? ¿Existe un porcentaje de dinero de donde las probabilidades de perder todo su dinero aumentan con el tiempo?
fuente
Respuestas:
Este es un problema bien conocido. Se llama una apuesta de Kelly. La respuesta, por cierto, es 1/3. Es equivalente a maximizar la utilidad de registro de la riqueza.
Kelly comenzó tomando tiempo al infinito y luego resolviendo hacia atrás. Como siempre puede expresar retornos en términos de capitalización continua, también puede revertir el proceso y expresarlo en registros. Voy a usar la explicación de la utilidad de registro, pero la utilidad de registro es una conveniencia. Si está maximizando la riqueza como , terminará con una función que resulta ser la misma que la utilidad de registro. Si es la probabilidad de pago, y es la probabilidad de ganar, y es el porcentaje de la riqueza invertida, entonces la siguiente derivación funcionará.n→∞ b p X
Para una apuesta binaria, , para un período único y riqueza unitaria.E(log(X) ) =plog( 1 +bX) + ( 1 - p)log( 1−X)
Poniendo la derivada a cero para encontrar los extremos,
Multiplicación cruzada, terminas conpb(1−X)−(1−p)(1+bX)=0
pb−pbX−1−bX+p+pbX=0
bX=pb−1+p
X=bp−(1−p)b
En su caso,X=3×12−(1−12)3=13.
Puede expandir esto fácilmente a resultados múltiples o continuos resolviendo la utilidad esperada de la riqueza sobre una distribución de probabilidad conjunta, eligiendo las asignaciones y sujeto a cualquier restricción. Curiosamente, si lo realiza de esta manera, incluyendo restricciones, como la capacidad de cumplir con los pagos de la hipoteca, etc., ha contabilizado su conjunto total de riesgos y, por lo tanto, tiene un riesgo ajustado o al menos controlado. solución.
Desiderata El propósito real de la investigación original tenía que ver con cuánto apostar en función de una señal ruidosa. En el caso específico, cuánto apostar en una señal electrónica ruidosa donde indicaba el lanzamiento de armas nucleares por parte de la Unión Soviética. Ha habido varios lanzamientos cercanos tanto de Estados Unidos como de Rusia, obviamente por error. ¿Cuánto apuestas por una señal?
fuente
Me gustó la respuesta dada por Dave harris. aunque trataría el problema desde una perspectiva de "bajo riesgo", en lugar de maximizar el beneficio
La caminata aleatoria que está haciendo, suponiendo que su apuesta de fracción es y la probabilidad de ganar tiene como donde . en promedio tiene Puede aplicar esto iterativamente para obtener con el valor esperado también puede expresar la cantidad en el tiempo en función de una sola variable aleatoria , pero observando que no es independiente deq p=0.5 Yt|Yt−1=(1−q+3qXt)Yt−1 Xt∼Bernoulli(p) E(Yt|Yt−1)=(1−q+3pq)Yt−1 Yt|Y0=Y0∏j=1t(1−q+3qXt) E(Yt|Y0)=(1−q+3pq)tY0 t Zt=∑tj=1Xt∼Binomial(t,p) Zt Zt−1
Yt|Y0=Y0(1+2q)Zt(1−q)t−Zt
posible estrategia
podría usar esta fórmula para determinar un valor de "bajo riesgo" para . Supongamos que quiere asegurarse de que después de pérdidas consecutivas todavía tenga la mitad de su riqueza original. Luego configuraq k q=1−2−k−1
Tomando el ejemplo significa que establecemos , o con establecemos .k=5 q=0.129 k=15 q=0.045
Además, debido a la naturaleza recursiva de la estrategia, este riesgo es lo que está tomando en cada apuesta. Es decir, en el momento , al continuar jugando, se asegura de que en el tiempo su riqueza sea al menoss k+s 0.5Ys
discusión
La estrategia anterior no depende de la recompensa de ganar, sino más bien de establecer un límite en la pérdida. Podemos obtener las ganancias esperadas al sustituir el valor de calculamos, y en el momento que se utilizó con el riesgo en mente.q k
sin embargo, es interesante observar la mediana en lugar de la rentabilidad esperada en el tiempo , que se puede encontrar asumiendo la . cuando tenemos la razón igual a . Esto se maximiza cuando y mayor que cuandot median(Zt)≈tp Yk|Y0=Y0(1+2q)tp(1−q)t(1−p) p=0.5 (1+q−2q2)0.5t q=0.25 1 q<0.5
También es interesante calcular la probabilidad de adelantarse en el momento . para hacer esto necesitamos determinar el valor tal que reorganizando algo, encontramos que la proporción de victorias debería satisfacer Esto se puede conectar a una aproximación normal (nota: media de y error estándar de ) comot z (1+2q)z(1−q)t−z>1 zt>log(1−q)log(1−q)−log(1+2q) 0.5 0.5t√ Pr(ahead at time t)≈Φ(t√log(1+2q)+log(1−q)[log(1+2q)−log(1−q)])
que muestra claramente que el juego tiene muy buenas probabilidades. el factor multiplicador se minimiza cuando (valor maximizado de ) y disminuye monotónicamente en función de . entonces la estrategia de "bajo riesgo" es apostar una fracción muy pequeña de su riqueza y jugar una gran cantidad de veces.t√ q=0 13 q
supongamos que comparamos esto con y . El factor para cada caso es y . Esto significa que después de juegos tendrías alrededor de un 95% de posibilidades de adelantarte con la apuesta pequeña, en comparación con un 75% de posibilidades con la apuesta más grande. Además, también tiene la posibilidad de ir a la quiebra con la apuesta más grande, suponiendo que tenga que redondear su apuesta a los 5 centavos o dólares más cercanos. Comenzando con esto podría ir . Esta es una secuencia de pérdidas de , y dado que el juego esperaríaq=13 q=1100 0.11 0.32 38 20 13.35,8.90,5.95,3.95,2.65,1.75,1.15,0.75,0.50,0.35,0.25,0.15,0.1,0.05,0 14 38 19 pérdidas, si tiene mala suerte con las primeras apuestas, incluso ganar puede no compensar una mala racha (por ejemplo, si la mayoría de sus ganancias se producen una vez que la mayor parte de la riqueza se ha ido) ir a la quiebra con la menor participación del 1% no es posible en juegos. La otra cara es que la apuesta más pequeña dará como resultado una ganancia mucho menor en promedio, algo así como un aumento de veces con la apuesta grande en comparación con un aumento de con la apuesta pequeña (es decir, espera tener 24 dólares después de 38 rondas con la apuesta pequeña). apuesta y 7000 dolares con la apuesta grande).38 350 1.2
fuente
No creo que esto sea muy diferente de la Martingala. En su caso, no hay apuestas duplicadas, pero el pago ganador es 3x.
Codifiqué una "réplica viva" de tu árbol. Corro 10 simulaciones. En cada simulación (traza), comienza con 200 monedas e intenta con el árbol, 1 moneda cada 20,000 veces.
Las únicas condiciones que detienen la simulación son la bancarrota o haber "sobrevivido" 20k intentos
Creo que cualesquiera que sean las probabilidades, tarde o temprano la bancarrota te espera.
El código es JavaScript improvisado pero sin dependencia: https://repl.it/@cilofrapez/MagicTree-Roulette
Le muestra los resultados de inmediato. El código es fácil de modificar: ejecutar cuantas simulaciones, cantidad de apuesta, cuantos intentos ... ¡No dude en jugar!
En la parte inferior del código, los resultados de cada simulación (por defecto 10) se guardan en un archivo CSV con dos columnas: número de giro y dinero. Lo hice para poder enviarlo a un trazador en línea para los gráficos.
Sería fácil tenerlo todo automatizado localmente usando la biblioteca de Gráficos de Google, por ejemplo. Si solo desea ver los resultados en la pantalla, puede comentar esa última parte como mencioné en el archivo.
EDITAR
Código fuente:
fuente
Planteamiento del problema
Caminata aleatoria
dónde
Probabilidad de quiebra
Martingala
La expresion
Probabilidad de terminar en bancarrota
Así
y
Conclusiones
Cualquiera que sea el porcentaje óptimo dependerá de cómo valore las diferentes ganancias. Sin embargo, podemos decir algo sobre la probabilidad de perderlo todo.
Solo cuando el jugador está apostando una fracción cero de su dinero, ciertamente no irá a la quiebra.
La probabilidad de ir a la quiebra depende de la distancia desde la cantidad de dinero donde el jugador quiebra. Cuandoq< qruina del jugador el dinero del jugador aumentará, en promedio, y la probabilidad de quiebra disminuirá, en promedio.
Probabilidad de quiebra cuando se utiliza el criterio de Kelly.
Cuando utiliza el criterio de Kelly mencionado en la respuesta de Dave Harris,q= 0.5 ( 1 - 1 / b ) , para si siendo la relación entre pérdida y ganancia en una sola apuesta, entonces independiente de si El valor de C será igual a 0.1 y la probabilidad de quebrar será 0.1S- L .
Es decir, independiente del parámetro de asimetría.si del árbol mágico, la probabilidad de quiebra, cuando se utiliza el criterio de Kelly, es igual a la proporción de la cantidad de dinero donde el jugador quiebra y la cantidad de dinero con la que el jugador comienza. Por diez dólares y 1 centavo, esta es una probabilidad de 1: 1000 de ir a la quiebra, cuando se utiliza el criterio de Kelly.
Simulaciones
Las simulaciones a continuación muestran diferentes trayectorias simuladas para diferentes estrategias de juego. Las trayectorias rojas son las que terminaron en bancarrota (golpear la líneaYt= - 2 )
Distribución de beneficios después del tiempo.t
Para ilustrar mejor los posibles resultados de las apuestas con el árbol del dinero, puede modelar la distribución deYt como un proceso de difusión unidimensional en un campo de fuerza homogéneo y con un límite absorbente (donde el jugador se arruina). La solución para esta situación ha sido dada por Smoluchowski
This diffusion equation relates to the tree problem when we set the speedc equal to the expected increase E[Yt] , we set D equal to the variance of the change in a single steps Var(Xt) , x0 is the initial amount of money, and t is the number of steps.
The image and code below demonstrate the equation:
The histogram shows the result from a simulation.
The dotted line shows a model when we use a naive normal distribution to approximate the distribution (this corresponds to the absence of the absorbing 'bankruptcy' barrier). This is wrong because some of the results above the bankruptcy level involve trajectories that have passed the bankruptcy level at an earlier time.
The continuous line is the approximation using the formula by Smoluchowski.
Codes
fuente