Estadísticas y Big Data

12
Límite superior exponencial

Supongamos que tenemos variables aleatorias IID con distribución . Vamos a observar una muestra de las 's de la siguiente manera: dejemos que sean variables aleatorias independientes , supongamos que todas las e ' s son independientes y definen el tamaño de la muestra . Los indican cuáles de los...

12
La idea de hacer que los datos tengan una media cero

A menudo veo personas que hacen que una dimensión / característica de un conjunto de datos sea de media cero al eliminar la media de todos los elementos. ¿Pero nunca entendí por qué hacerlo? ¿Cuál es el efecto de hacer eso como un paso de preprocesamiento? ¿Mejora el rendimiento de la...

12
Cómo usar auto.arima para imputar valores perdidos

Tengo una serie de zoológicos con muchos valores perdidos. ¿Leí que auto.arimapuede imputar estos valores faltantes? ¿Alguien puede enseñarme cómo hacerlo? ¡muchas gracias! Esto es lo que he intentado, pero sin éxito: fit <-

12
¿Qué prueba estadística usar para la prueba A / B?

Tenemos dos cohortes de 1000 muestras cada una. Medimos 2 cantidades en cada cohorte. El primero es una variable binaria. El segundo es un número real que sigue una distribución de cola pesada. Queremos evaluar qué cohorte funciona mejor para cada métrica. Hay muchas pruebas estadísticas para...

12
¿Buena forma de eliminar los valores atípicos?

Estoy trabajando en estadísticas para compilaciones de software. Tengo datos para cada compilación en pasar / fallar y el tiempo transcurrido y generamos ~ 200 de estos / semana. La tasa de éxito es fácil de agregar, puedo decir que el 45% pasó cualquier semana. Pero también me gustaría agregar el...