Preguntas etiquetadas con aggregation

Se refiere a "agrupar" grupos de datos potencialmente no homogéneos.

20
¿Cuáles son los valores correctos para precisión y recuperación en casos extremos?

La precisión se define como: p = true positives / (true positives + false positives) ¿Es cierto que, como true positivesy false positivesenfoque 0, la precisión se aproxima a 1? La misma pregunta para recordar: r = true positives / (true positives + false negatives) Actualmente estoy...

13
LARS vs descenso coordinado para el lazo

¿Cuáles son los pros y los contras de usar LARS [1] versus usar el descenso coordinado para ajustar la regresión lineal regularizada por L1? Estoy principalmente interesado en los aspectos de rendimiento (mis problemas tienden a tener Ncientos de miles y p<20). Sin embargo, cualquier otra...

12
¿Qué estadísticas se conservan bajo agregación?

Si tenemos una serie de tiempo larga y de alta resolución, con mucho ruido, a menudo tiene sentido agregar los datos a una resolución más baja (digamos, valores diarios a mensuales) para obtener una mejor comprensión de lo que está sucediendo, eliminando efectivamente algunos de el ruido. He visto...

11
¿Debo ejecutar regresiones separadas para cada comunidad, o la comunidad puede ser simplemente una variable de control en un modelo agregado?

Estoy ejecutando un modelo OLS con una variable de índice de activo continuo como DV. Mis datos se agregan de tres comunidades similares en estrecha proximidad geográfica entre sí. A pesar de esto, pensé que era importante usar la comunidad como una variable de control. Resulta que la comunidad es...

9
Calcular curva ROC para datos

Entonces, tengo 16 ensayos en los que estoy tratando de autenticar a una persona de un rasgo biométrico usando Hamming Distance. Mi umbral está establecido en 3.5. Mis datos están a continuación y solo la prueba 1 es un verdadero positivo: Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5...