¿Es posible implementar múltiples softmaxes en la última capa en Keras? Entonces la suma de los nodos 1-4 = 1; 5-8 = 1; etc. ¿Debo optar por un diseño de red
¿Es posible implementar múltiples softmaxes en la última capa en Keras? Entonces la suma de los nodos 1-4 = 1; 5-8 = 1; etc. ¿Debo optar por un diseño de red
Tengo un problema de clasificación con datos categóricos y numéricos. El problema que enfrento es que mis datos categóricos no son fijos, eso significa que el nuevo candidato cuya etiqueta quiero predecir puede tener una nueva categoría que no se observó de antemano. Por ejemplo, si mis datos...
Cerrada . Esta pregunta necesita estar más centrada . Actualmente no está aceptando respuestas. ¿Quieres mejorar esta pregunta? Actualice la pregunta para que se centre en un problema solo editando esta publicación . Cerrado hace 5 años . Parece que la...
He leído la explicación de la convolución y la entiendo hasta cierto punto. ¿Alguien puede ayudarme a entender cómo esta operación se relaciona con la convolución en redes neuronales convolucionales? ¿Es el filtro como una función gque aplica
Tengo un conjunto de datos que contiene ~ 100,000 muestras de 50 clases. He estado usando SVM con un núcleo RBF para entrenar y predecir nuevos datos. Sin embargo, el problema es que el conjunto de datos está sesgado hacia diferentes clases. Por ejemplo, Clase 1 - 30 (~ 3% cada uno), Clase 31 - 45...
Estoy trabajando en una aplicación para ayudar a las personas a aprender inglés como segundo idioma. He validado que las oraciones ayudan a aprender un idioma al proporcionar un contexto adicional. Lo hice realizando una pequeña investigación en un aula de 60 estudiantes. He extraído más de cien...
He estado analizando un conjunto de datos de ~ 400k registros y 9 variables. La variable dependiente es binaria. He ajustado una regresión logística, un árbol de regresión, un bosque aleatorio y un árbol impulsado por gradiente. Todos ellos dan virtualmente idénticos números de bondad de ajuste...
Descripción general del problema. Tengo un gráfico donde algunos vértices están etiquetados con un tipo con 3 o 4 valores posibles. Para los otros vértices, el tipo es desconocido. Mi objetivo es usar el gráfico para predecir el tipo de vértices que no están etiquetados. Marco posible Sospecho...
Actualmente estoy entrenando una red neuronal y no puedo decidir qué usar para implementar mis criterios de detención temprana: pérdida de validación o una métrica como precisión / f1score / auc / lo que se calcule en el conjunto de validación. En mi investigación, encontré artículos que defienden...
Me enfrento a una situación en la que el número de ejemplos positivos y negativos en un conjunto de datos está desequilibrado. Mi pregunta es, ¿hay alguna regla general que nos diga cuándo debemos submuestrear la categoría grande para forzar algún tipo de equilibrio en el conjunto de...
Creé un clasificador Naive Bayes que utiliza la técnica de la bolsa de palabras para clasificar las publicaciones de spam en un tablero de mensajes. Funciona, pero creo que podría obtener mejores resultados si mis modelos consideraran el orden de las palabras y las frases. (p. ej., 'chicas' y 'en...
Estoy buscando diseñar un sistema que, dado un párrafo de texto, pueda clasificarlo e identificar el contexto: Está entrenado con párrafos de texto generados por el usuario (como comentarios / preguntas / respuestas) Se etiquetará cada elemento del conjunto de entrenamiento. Entonces, por...
Tengo dos tensor a:[batch_size, dim] b:[batch_size, dim]. Quiero hacer un producto interno para cada par en el lote, generando c:[batch_size, 1], dónde c[i,0]=a[i,:].T*b[i,:].
Cerrada . Esta pregunta necesita estar más centrada . Actualmente no está aceptando respuestas. ¿Quieres mejorar esta pregunta? Actualice la pregunta para que se centre en un problema solo editando esta publicación . Cerrado hace 4 años . Estoy...
Tengo un conjunto de datos que incluye un conjunto de clientes en diferentes ciudades de California, la hora de llamar a cada cliente y el estado de la llamada (Verdadero si el cliente responde la llamada y Falso si el cliente no responde). Tengo que encontrar un momento adecuado para llamar a...
Problema Intenté usar Naive bayes en un conjunto de datos etiquetados de datos delictivos, pero obtuve resultados realmente pobres (7% de precisión). Naive Bayes corre mucho más rápido que otros alogoritmos que he estado usando, así que quería intentar descubrir por qué el puntaje era tan...
Mi conjunto de datos se compone de secuencias vectoriales. Cada vector tiene 50 dimensiones de valor real. El número de vectores en una secuencia varía de 3-5 a 10-15. En otras palabras, la longitud de una secuencia no es fija. Una buena cantidad de secuencias (¡no vectores!) Están anotadas con...
¿Qué conjuntos de datos disponibles libremente puedo usar para entrenar un clasificador de texto? Estamos tratando de mejorar la participación de nuestros usuarios recomendando el contenido más relacionado para él, por lo que pensamos que si clasificamos nuestro contenido en función de una bolsa...
Tengo un gran conjunto de datos de una base de datos relacional para la que necesito crear un modelo de clasificación. Normalmente para esta situación, usaría Programación Lógica Inductiva (ILP), pero debido a circunstancias especiales no puedo hacer eso. La otra forma de abordar esto sería tratar...
Estoy buscando una biblioteca de Python que pueda calcular la matriz de confusión para la clasificación de etiquetas múltiples . FYI: scikit-learn no admite etiquetas múltiples para matriz de confusión) ¿Cuál es la diferencia entre Multiclass y Multilabel