Estadísticas y Big Data

12
¿Qué estadísticas se conservan bajo agregación?

Si tenemos una serie de tiempo larga y de alta resolución, con mucho ruido, a menudo tiene sentido agregar los datos a una resolución más baja (digamos, valores diarios a mensuales) para obtener una mejor comprensión de lo que está sucediendo, eliminando efectivamente algunos de el ruido. He visto...

12
Valor que aumenta la desviación estándar

Me sorprende la siguiente declaración: "Para aumentar la desviación estándar de un conjunto de números, debe agregar un valor que esté a más de una desviación estándar de la media" ¿Cuál es la prueba de eso? Por supuesto, sé cómo definimos la desviación estándar, pero esa parte parece que de...

12
¿Hay un nombre mejor que "promedio de la integral"?

Estoy probando los sensores de posición del acelerador (TPS) que vende mi empresa e imprimo el diagrama de respuesta de voltaje a la rotación del eje del acelerador. Un TPS es un sensor giratorio con 90 ° de rango y la salida es como un potenciómetro con una apertura total de 5V (o valor de entrada...

12
Bondad de ajuste para muestras muy grandes

Recopilo muestras muy grandes (> 1,000,000) de datos categóricos cada día y quiero ver que los datos se vean "significativamente" diferentes entre días para detectar errores en la recopilación de datos. Pensé que usar una prueba de buen ajuste (en particular, una prueba G) sería un buen ajuste...

12
En R cómo calcular el valor p para el área bajo ROC

Me cuesta encontrar una manera de calcular el valor p para el área bajo una característica del operador receptor (ROC). Tengo una variable continua y un resultado de prueba de diagnóstico. Quiero ver si AUROC es estadísticamente significativo. Encontré muchos paquetes relacionados con curvas ROC:...

12
¿Por qué algunas personas prueban los supuestos del modelo similar a la regresión en sus datos sin procesar y otras personas los prueban en el residual?

Soy un estudiante de doctorado en psicología experimental y me esfuerzo por mejorar mis habilidades y conocimientos sobre cómo analizar mis datos. Hasta mi quinto año en psicología, pensé que los modelos de regresión (por ejemplo, ANOVA) suponen lo siguiente: normalidad de los datos homogeneidad...