En el procesamiento de imágenes médicas, la mayoría de los trabajos publicados intentan reducir la tasa de falsos positivos (FPR), mientras que en realidad los falsos negativos son más peligrosos que los falsos positivos. ¿Cuál es la razón detrás de
En el procesamiento de imágenes médicas, la mayoría de los trabajos publicados intentan reducir la tasa de falsos positivos (FPR), mientras que en realidad los falsos negativos son más peligrosos que los falsos positivos. ¿Cuál es la razón detrás de
En mi clase, tengo que crear una aplicación usando dos clasificadores para decidir si un objeto en una imagen es un ejemplo de phylum porifera (seasponge) o algún otro objeto. Sin embargo, estoy completamente perdido cuando se trata de técnicas de extracción de características en Python. Mi asesor...
Estoy jugando un poco con convnets. Específicamente, estoy usando el conjunto de datos kaggle cats-vs-dogs que consta de 25000 imágenes etiquetadas como gato o perro (12500 cada una). Me las arreglé para lograr una precisión de clasificación de alrededor del 85% en mi conjunto de pruebas, sin...
Quiero entrenar a una CNN para el reconocimiento de imágenes. Las imágenes para entrenamiento no tienen un tamaño fijo. Quiero que el tamaño de entrada para el CNN sea 50x100 (alto x ancho), por ejemplo. Cuando cambio el tamaño de algunas imágenes de tamaño pequeño (por ejemplo, 32x32) al tamaño de...
Estoy comenzando un proyecto donde la tarea es identificar los tipos de zapatillas a partir de imágenes. Actualmente estoy leyendo las implementaciones de TensorFlow y Torch . Mi pregunta es: ¿cuántas imágenes por clase se requieren para alcanzar un rendimiento de clasificación razonable?...
La mayoría de los modelos avanzados de aprendizaje profundo como VGG, ResNet, etc. requieren imágenes cuadradas como entrada, generalmente con un tamaño de píxel de .224x224224x224224x224 ¿Hay alguna razón por la cual la entrada tiene que tener la misma forma, o puedo construir un modelo de...
¿Cuál es el problema de salto de dimensión en el aprendizaje automático (que ocurre en redes neuronales convolucionales y reconocimiento de imágenes)? Lo busqué en Google, pero todo lo que obtengo es información sobre la Física de la deformación de la forma del material. Será más útil para mí si...
He leído la explicación de la convolución y la entiendo hasta cierto punto. ¿Alguien puede ayudarme a entender cómo esta operación se relaciona con la convolución en redes neuronales convolucionales? ¿Es el filtro como una función gque aplica
Suponga que tiene un archivo de video cuyo orden de píxeles se ha barajado una vez. Es decir, un orden aleatorio se definió una vez y se aplicó a todos los marcos. ¿Existe algún enfoque conocido para recuperar el orden inicial de píxeles? Tengo algunas ideas sobre cómo recuperar la topología...