Preguntas etiquetadas con computer-vision

22

¿Cómo calcular mAP para la tarea de detección para el desafío PASCAL VOC?

¿Cómo calcular el mAP (precisión media promedio) para la tarea de detección de las tablas de clasificación de Pascal VOC? http://host.robots.ox.ac.uk:8080/leaderboard/displaylb.php?challengeid=11&compid=4 Dicho esto, en la página 11 :

18

¿Cuál es la diferencia entre Inception v2 e Inception v3?

El documento Profundizando en convoluciones describe GoogleNet que contiene los módulos de inicio originales: El cambio al inicio v2 fue que reemplazaron las convoluciones 5x5 por dos convoluciones sucesivas 3x3 y la agrupación aplicada: ¿Cuál es la diferencia entre Inception v2 e Inception...

image-classification convnet computer-vision inception

17

¿Qué significa la notación mAP @ [. 5: .95]?

Para la detección, una forma común de determinar si la propuesta de un objeto era correcta es Intersección sobre Unión (IoU, IU). Esto toma el conjunto de píxeles de objetos propuestos y el conjunto de píxeles verdaderos de objetos B y calcula:UNUNAsisiB yoo U( A , B ) = A ∩ BA ∪...

computer-vision

13

Por qué las convoluciones siempre usan números impares como filter_size

Si echamos un vistazo al 90-99% de los artículos publicados usando una CNN (ConvNet). La gran mayoría de ellos usa el tamaño de filtro de números impares : {1, 3, 5, 7} para los más utilizados. Esta situación puede generar algún problema: con estos tamaños de filtro, generalmente la operación de...

deep-learning convnet computer-vision convolution

11

¿Cuál es la diferencia entre convolución dilatada y deconvolución?

Estas dos operaciones de convolución son muy comunes en el aprendizaje profundo en este momento. Leí sobre la capa convolucional dilatada en este artículo: WAVENET: UN MODELO GENERATIVO PARA AUDIO CRUDO y De-convolution se encuentra en este documento: Redes completamente convolucionales para la...

machine-learning deep-learning convnet computer-vision convolution

11

¿Hay algún buen modelo de lenguaje listo para usar para Python?

Estoy creando prototipos de una aplicación y necesito un modelo de lenguaje para calcular la perplejidad en algunas oraciones generadas. ¿Hay algún modelo de lenguaje entrenado en Python que pueda usar fácilmente? Algo simple como model = LanguageModel('en') p1 = model.perplexity('This is a well...

python nlp language-model r statistics linear-regression machine-learning classification random-forest xgboost python sampling data-mining orange predictive-modeling recommender-system statistics dimensionality-reduction pca machine-learning python deep-learning keras reinforcement-learning neural-network image-classification r dplyr deep-learning keras tensorflow lstm dropout machine-learning sampling categorical-data data-imputation machine-learning deep-learning machine-learning-model dropout deep-network pandas data-cleaning data-science-model aggregation python neural-network reinforcement-learning policy-gradients r dataframe dataset statistics prediction forecasting r k-means python scikit-learn labels python orange cloud-computing machine-learning neural-network deep-learning rnn recurrent-neural-net logistic-regression missing-data deep-learning autoencoder apache-hadoop time-series data preprocessing classification predictive-modeling time-series machine-learning python feature-selection autoencoder deep-learning keras tensorflow lstm word-embeddings predictive-modeling prediction machine-learning-model machine-learning classification binary theory machine-learning neural-network time-series lstm rnn neural-network deep-learning keras tensorflow convnet computer-vision

10

¿Cómo puedo detectar si una imagen fue retocada?

Me gustaría verificar los archivos JPG si fueron manipulados para cambiar el contenido. Lo que considero NO photoshopped: Recortar Giratorio (Escalada) Resolución de imagen Los cambios automáticos que pueden hacer los teléfonos inteligentes Lo que considero photoshopping: Agregar una nueva...

computer-vision

10

Segmentación de imagen sin supervisión

Estoy tratando de implementar un algoritmo donde, dada una imagen con varios objetos en una tabla plana, se desea la salida de máscaras de segmentación para cada objeto. A diferencia de las CNN, el objetivo aquí es detectar objetos en un entorno desconocido. ¿Cuáles son los mejores enfoques para...

machine-learning deep-learning cnn computer-vision object-detection

9

¿Existen estudios que examinen la deserción escolar versus otras regularizaciones?

¿Hay algún documento publicado que muestre diferencias en los métodos de regularización para redes neuronales, preferiblemente en diferentes dominios (o al menos diferentes conjuntos de datos)? Lo pregunto porque actualmente tengo la sensación de que la mayoría de las personas parecen usar solo el...

neural-network computer-vision convnet regularization dropout

9

Número de parámetros para capas de convolución

En este artículo altamente citado , los autores dan la siguiente discusión sobre el número de parámetros de peso. No tengo muy claro por qué tiene parámetros C 2 . Creo que debería ser 49 C ya que cada uno de los canales de entrada C comparte el mismo filtro, que tiene 49 parámetros.49...

machine-learning deep-learning computer-vision

8

El reconocimiento humano en imágenes a través del descriptor HOG y el clasificador SVM funciona mal

Estoy usando un descriptor HOG, junto con un clasificador SVM, para reconocer a los humanos en imágenes. Estoy usando los envoltorios de Python para OpenCV. He utilizado el excelente tutorial en pymagesearch , que explica lo que hace el algoritmo y proporciona sugerencias sobre cómo establecer los...

python computer-vision object-recognition

8

Uso de redes neuronales para extraer múltiples parámetros de imágenes

Quiero extraer parámetros de una imagen usando una red neuronal. Ejemplo: Dada una imagen de una pared de ladrillos, el NN debe extraer el ancho y la altura de los ladrillos, el color y la aspereza. Puedo generar imágenes para parámetros dados para entrenar el NN y quiero usarlo para extraer los...

neural-network deep-learning computer-vision