Estadísticas y Big Data

11
Cómo proyectar uniformemente un hash en un número fijo de cubos

Hola colegas estadísticos, Tengo una fuente que genera hashes (por ejemplo, calcular una cadena con una marca de tiempo y otra información y hashing con md5) y quiero proyectarla en un número fijo de cubos (digamos 100). hash de muestra: 0fb916f0b174c66fd35ef078d861a367 Lo que pensé al principio...

11
Mejora de nombres de variables en un conjunto de datos

Los buenos nombres de variables son: a) corto / fácil de escribir, b) fácil de recordar, c) comprensible / comunicativo. ¿Estoy olvidando algo? La consistencia es algo a tener en cuenta. La forma en que lo diría es que las convenciones de nomenclatura consistentes contribuyen a las...

11
Selección de modelo ABC

Se ha demostrado que no se recomienda la elección del modelo ABC utilizando factores de Bayes debido a la presencia de un error derivado del uso de estadísticas resumidas. La conclusión en este artículo se basa en el estudio del comportamiento de un método popular para aproximar el factor de Bayes...

11
¿Existe tal cosa como un dado justo?

¿Existe tal cosa como un dado justo? En los dados donde el número está representado por un punto recogido, ¿seguro que eso marca la diferencia? ¿Alguien ha hecho alguna investigación? De hecho, pensando en ello, ¿por qué sería justo lanzar una moneda? La física en cada lado es completamente...

11
Clases de distribuciones cerradas bajo máximo

Supongamos que es una clase de distribuciones de probabilidad en reales no negativos parametrizados por , de modo que Me pregunto qué clases conocidas de distribuciones están cerradas tomando el máximo y, es decir, si y son independientes, entonces

11
¿Media

Estoy trabajando en datos muy sesgados, así que estoy usando la mediana en lugar de la media para resumir la tendencia central. Me gustaría tener una medida de dispersión Si bien a menudo veo personas que informan media desviación estándar±±\pm o mediana cuartiles±±\pm para resumir la tendencia...