Estadísticas y Big Data

9
¿Cómo usar R gbm con distribution = "adaboost"?

La documentación establece que R gbm with distribution = "adaboost" se puede usar para problemas de clasificación 0-1. Considere el siguiente fragmento de código: gbm_algorithm <- gbm(y ~ ., data = train_dataset, distribution = "adaboost", n.trees = 5000) gbm_predicted <-...

9
Determinación del mayor contribuyente en un grupo

No sé mucho sobre estadísticas, así que tengan paciencia conmigo. Digamos que tengo un conjunto de 1000 trabajadores. Quiero averiguar quién es el trabajador más duro, pero solo puedo medir la cantidad de trabajo que se realiza en grupos de 1 a 100 durante más de una hora de trabajo. Suponiendo que...

9
PCA, ICA y mapas propios laplacianos

Estoy muy interesado en el método de mapas propios de Laplacia. Actualmente, lo estoy usando para reducir la dimensión de mis conjuntos de datos médicos. Sin embargo, me he encontrado con un problema al usar el método. Por ejemplo, tengo algunos datos (señales de espectros), puedo usar PCA (o...

9
¿Distribuciones en subconjuntos de ?

Me pregunto si hay algún tipo de distribución estándar en subconjuntos de enteros . De manera equivalente, podríamos expresar esto como una distribución en un vector de longitud de resultados binarios, por ejemplo, si entonces corresponde al vector .{1,2,...,J}{1,2,...,J}\{1, 2, ..., J\}JJJJ=5J=5J...