Ciencia de los datos

8
Cómo aplicar el gradiente de softmax en backprop

Recientemente hice una tarea donde tuve que aprender un modelo para la clasificación de 10 dígitos del MNIST. El HW tenía un código de andamiaje y se suponía que debía trabajar en el contexto de este código. Mi tarea funciona / pasa las pruebas, pero ahora estoy tratando de hacerlo todo desde cero...

8
Gradientes sintéticos: ¿cuál es el beneficio práctico?

Puedo ver dos motivos para usar degradados sintéticos en RNN: Para acelerar el entrenamiento, corrigiendo inmediatamente cada capa con gradiente predicho Para poder aprender secuencias más largas Veo problemas con los dos. Tenga en cuenta que realmente me gustan los degradados sintéticos...

8
El punto de control del modelo de Keras no funciona

Estoy tratando de entrenar un modelo en keras y estoy usando ModelCheckpoint para guardar el mejor modelo de acuerdo con una métrica de validación monitoreada (en mi caso, el índice Jaccard ). Si bien puedo ver que el modelo mejora en el tensorboard, cuando trato de cargar los pesos y evaluar el...

8
¿Cómo usar SMOTE en Java Weka API?

Estoy tratando de construir un modelo de clasificación usando la API Java Weka. Mi conjunto de datos de entrenamiento tiene problemas de desequilibrio de clase. Por esta razón, quiero usar SMOTE para reducir el problema de desequilibrio de clase. Pero, no sé cómo usarlo en la API Java...

8
¿Se considera una "curva" "lineal"?

En regresión lineal, estamos ajustando un polinomio a un conjunto de puntos de datos. En el libro de Bishop de Pattern Recognition & Machine Learning, hay algunos ejemplos en los que el ajuste es una curva o una línea recta. Estoy un poco confundido si una curva es lineal o no. El término...

7
Identificación de "grupos" o "grupos" en una matriz

Tengo una matriz que se rellena con elementos discretos, y necesito agruparlos (usando R) en grupos intactos. Entonces, por ejemplo, tome esta matriz: [A B B C A] [A A B A A] [A B B C C] [A A A A A] Habría dos grupos separados para A, dos grupos separados para C y un grupo para B. La salida...