Supongamos que tienes ocho corredores corriendo una carrera; la distribución de sus tiempos de ejecución individuales es Normal y cada uno tiene una media de segundos, por ejemplo. La desviación estándar del corredor uno es la más pequeña, dos la segunda más pequeña, la tercera más pequeña, etc., y ocho la más grande. Dos preguntas me confunden: (1) ¿Cuál es la probabilidad de que el primero venza al último y (2) quién tiene más probabilidades de ganar la carrera?
Mis respuestas son y , respectivamente. Dado que comparten la misma media, la probabilidad de que es sólo , no? ¿Cómo puedo demostrar rigurosamente la segunda parte y se puede calcular una probabilidad exacta de ganar? Gracias por adelantado.
Respuestas:
Aunque no se puede calcular una probabilidad exacta (excepto en circunstancias especiales con ), se puede calcular numéricamente rápidamente con gran precisión. A pesar de esta limitación, se puede demostrar rigurosamente que el corredor con la mayor desviación estándar tiene la mayor posibilidad de ganar. La figura muestra la situación y muestra por qué este resultado es intuitivamente obvio:n≤2
Se muestran las densidades de probabilidad para los tiempos de cinco corredores. Todos son continuos y simétricos sobre una media común.μ . (Se utilizaron densidades beta escaladas para garantizar que todos los tiempos sean positivos). Una densidad, dibujada en azul más oscuro, tiene una propagación mucho mayor. La porción visible en su cola izquierda representa los tiempos que ningún otro corredor puede igualar. Debido a que esa cola izquierda, con su área relativamente grande, representa una probabilidad apreciable, el corredor con esta densidad tiene la mayor probabilidad de ganar la carrera. (¡También tienen la mayor posibilidad de llegar al final!)
Estos resultados están probados para algo más que distribuciones normales: los métodos presentados aquí se aplican igualmente bien a distribuciones simétricas y continuas. (Esto será de interés para cualquier persona que se oponga al uso de distribuciones normales para modelar tiempos de ejecución). Cuando se violan estas suposiciones, es posible que el corredor con la mayor desviación estándar no tenga la mayor posibilidad de ganar (dejo la construcción de contraejemplos a lectores interesados), pero aún podemos probar bajo suposiciones más suaves que el corredor con mayor SD tendrá la mejor oportunidad de ganar siempre que SD sea lo suficientemente grande.
La figura también sugiere que se podrían obtener los mismos resultados al considerar los análogos unilaterales de la desviación estándar (la llamada "semivariancia"), que miden la dispersión de una distribución a un solo lado. Un corredor con gran dispersión hacia la izquierda (hacia mejores tiempos) debería tener una mayor posibilidad de ganar, independientemente de lo que ocurra en el resto de la distribución. Estas consideraciones nos ayudan a apreciar cómo la propiedad de ser el mejor (en un grupo) difiere de otras propiedades como los promedios.
Deje ser variables aleatorias que representan los tiempos de los corredores. La pregunta supone que son independientes y normalmente distribuidos con media común μ . (Aunque este es literalmente un modelo imposible, ya que presenta probabilidades positivas para tiempos negativos, aún puede ser una aproximación razonable a la realidad siempre que las desviaciones estándar sean sustancialmente más pequeñas que μ ).X1,…,Xn μ μ
Para llevar a cabo el siguiente argumento, conserve la suposición de independencia, pero suponga que las distribuciones de son dadas por F i y que estas leyes de distribución pueden ser cualquier cosa. Por conveniencia, también suponga que la distribución F n es continua con densidad f n . Más tarde, según sea necesario, podemos aplicar supuestos adicionales siempre que incluyan el caso de distribuciones normales.Xi Fi Fn fn
Para cualquier e infinitesimal d y , la probabilidad de que el último corredor tenga un tiempo en el intervalo ( y - d y , y ] y sea el corredor más rápido se obtiene multiplicando todas las probabilidades relevantes (porque todos los tiempos son independientes):y dy (y−dy,y]
La integración sobre todas estas posibilidades mutuamente excluyentes produce
Para distribuciones normales, esta integral no puede evaluarse en forma cerrada cuando : necesita evaluación numérica.n>2
Esta figura traza el integrando para cada uno de los cinco corredores que tienen desviaciones estándar en la proporción 1: 2: 3: 4: 5. Cuanto más grande sea la SD, más se desplazará la función hacia la izquierda, y mayor será su área. Las áreas son aproximadamente 8: 14: 21: 26: 31%. En particular, el corredor con la mayor SD tiene un 31% de posibilidades de ganar.
Aunque no se puede encontrar una forma cerrada, aún podemos sacar conclusiones sólidas y demostrar que el corredor con la mayor SD tiene más probabilidades de ganar. Necesitamos estudiar lo que sucede cuando la desviación estándar de una de las distribuciones, digamos , cambia. Cuando la variable aleatoria X n se vuelve a escalar por σ > 0 alrededor de su media, su SD se multiplica por σ y f n ( y ) d y cambiará a f n ( y / σ ) d y / σFn Xn σ>0 σ fn(y)dy fn(y/σ)dy/σ . Hacer el cambio de la variable en la integral da una expresión para la posibilidad de que el corredor n gane, en función de σ :y=xσ n σ
Supongamos ahora que las medianas de todas las distribuciones son iguales y que todas las distribuciones son simétricas y continuas, con densidades f i . (Este ciertamente es el caso en las condiciones de la pregunta, porque una mediana normal es su media). Mediante un cambio simple (de ubicación) de la variable podemos suponer que esta mediana común es 0 ; la simetría significa f n ( y ) = f n ( - y ) y 1 - F j ( - y ) = F j ( )n fi 0 fn(y)=fn(−y) 1−Fj(−y)=Fj(y) y (−∞,0] (0,∞)
The functionϕ is differentiable. Its derivative, obtained by differentiating the integrand, is a sum of integrals where each term is of the form
fori=1,2,…,n−1 .
The assumptions we made about the distributions were designed to assure thatFj(x)≥1−Fj(x) for x≥0 . Thus, since x=yσ≥0 , each term in the left product exceeds its corresponding term in the right product, implying the difference of products is nonnegative. The other factors yfn(y)fi(yσ) are clearly nonnegative because densities cannot be negative and y≥0 . We may conclude that ϕ′(σ)≥0 for σ≥0 , proving that the chance that player n wins increases with the standard deviation of Xn .
This is enough to prove that runnern will win provided the standard deviation of Xn is sufficiently large. This is not quite satisfactory, because a large SD could result in a physically unrealistic model (where negative winning times have appreciable chances). But suppose all the distributions have identical shapes apart from their standard deviations. In this case, when they all have the same SD, the Xi are independent and identically distributed: nobody can have a greater or lesser chance of winning than anyone else, so all chances are equal (to 1/n ). Start by setting all distributions to that of runner n . Now gradually decrease the SDs of all other runners, one at a time. As this occurs, the chance that n wins cannot decrease, while the chances of all the other runners have decreased. Consequently, n has the greatest chances of winning, QED.
fuente