Estadísticas y Big Data

11
Produce automáticamente resumen por variable de factor en R

Tengo un marco de datos como el siguiente: case simulation temp plank oxygen 1 1 1 8 7 11 2 2 1 16 10 15 ... 17 17 2 26 12 17 18 18 2 15 8 12 19 19 2 28 11 21 20 20 2 24 6 14 Me gustaría obtener resúmenes divididos por los niveles de la variable de simulación. Por ejemplo, me gustaría la media...

11
¿Cómo se prueba una implementación de k-means?

Descargo de responsabilidad: publiqué esta pregunta en Stackoverflow, pero pensé que quizás esto sea más adecuado para esta plataforma. ¿Cómo prueba su propia implementación de k-means para conjuntos de datos multidimensionales? Estaba pensando en ejecutar una implementación ya existente (es...

11
Varianza de dos variables aleatorias ponderadas

Dejar: Desviación estándar de la variable aleatoria A = σ1= 5A=σ1=5A =\sigma_{1}=5 Desviación estándar de la variable aleatoria B = σ2= 4B=σ2=4B=\sigma_{2}=4 Entonces la varianza de A + B es: Va r ( w1A + w2B ) = w21σ21+ w22σ22+ 2 w1w2pag1 ,

11
¿Cuánta información puedes extraer de un nombre?

Un nombre: primero, posiblemente un segundo nombre y apellido. Tengo curiosidad acerca de cuánta información puede extraer de un nombre, utilizando conjuntos de datos disponibles públicamente. Sé que puede obtener lo siguiente en cualquier lugar entre una probabilidad baja-alta (dependiendo de la...

11
Detectar cambios en series de tiempo

Me encontré con una imagen de un prototipo de aplicación que encuentra cambios significativos ("tendencias" - no picos / valores atípicos) en los datos de tráfico: Quiero escribir un programa (Java, opcionalmente R) que pueda hacer lo mismo, pero debido a que mis habilidades estadísticas están...

11
Medición de la regresión a la media al golpear jonrones

Cualquiera que siga el béisbol probablemente haya escuchado sobre el desempeño inesperado del tipo MVP del José Bautista de Toronto. En los cuatro años anteriores, bateó aproximadamente 15 jonrones por temporada. El año pasado llegó a 54, un número superado por solo 12 jugadores en la historia del...

11
Predecir procesos de memoria larga

Estoy trabajando con un proceso de dos estados con en paraxtxtx_t{1,−1}{1,−1}\{1, -1\}t=1,2,…t=1,2,…t = 1, 2, \ldots La función de autocorrelación es indicativa de un proceso con memoria larga, es decir, muestra una disminución de la ley de potencia con un exponente <1. Puede simular una serie...