Creé una página web que muestra los resultados de medallas olímpicas en vivo de Thompson Reuters y los recuentos de la población mundial de la CIA.
Los resultados son interesantes para mí: Hungría tiene una ventaja de dos dígitos en medallas de oro sobre el resto del mundo. Además, EE. UU. Y China están casi al final en casi todas las categorías.
Mi pregunta es: ¿estoy presentando los datos de manera justa? Simplemente tomé la población más grande y luego creé un factor para cada país basado en eso. Las columnas relativas de conteo de medallas se basan en ese factor.
¿Qué columna (s) podría agregar? ¿Qué otros factores podría agregar para presentar la visión más justa? La visión absoluta es fácil: Reuters lo hace. ¿Cómo crear una vista justa?
fuente
Respuestas:
Está tratando de encontrar una estimación de la posibilidad de que un individuo gane una medalla, sabiendo que los "datos" que tenemos son solo el número por país. Es una gran pregunta una solución justa estar más cerca del espíritu de los Juegos Olímpicos.
Básicamente, este es un problema estadístico que se aproxima bien por su método como el número promedio (frecuencia) de medallas (para cada color) en relación con la población. Pero, ¿qué tan confiable es este método? Esto está bastante cerca del problema de estimar la confiabilidad de un lanzamiento binomial de diferentes números de lanzamientos que tiene aplicaciones, por ejemplo, para comparar la calidad de los revendedores en Amazon en función de diferentes números de comentarios (consulte esta explicación detallada ).
En este caso particular, el número de la población siempre es suficiente para hacer que la aproximación de la distribución beta sea normal, de modo que ciertamente es posible comparar la significatividad de cada estimación para cada país.
fuente