Si pudiera implementar un SVM, puede cuantificar las características. :)
Típicamente, las características se cuantifican usando el agrupamiento de k-means. Primero, usted decide cuál debe ser su "tamaño de vocabulario" (digamos 200 "palabras visuales"), y luego ejecuta k-significa agrupación para ese número de agrupaciones (200). Los descriptores SIFT son vectores de 128 elementos, es decir, puntos en un espacio de 128 dimensiones. Por lo tanto, puede intentar agruparlos, como cualquier otro punto. Extrae los descriptores SIFT de una gran cantidad de imágenes, similares a las que desea clasificar utilizando la bolsa de características. (Idealmente, este debería ser un conjunto separado de imágenes, pero en la práctica, las personas a menudo solo obtienen características de su conjunto de imágenes de entrenamiento). Luego, ejecuta el agrupamiento k-means en este gran conjunto de descriptores SIFT para dividirlo en 200 (o lo que sea) grupos , es decir, asignar cada descriptor a un grupo. k-means le dará 200 centros de clúster,
Luego, toma cada descriptor SIFT en su imagen y decide a cuál de los 200 grupos pertenece, encontrando el centro del grupo más cercano a él. Luego, simplemente cuenta cuántas características de cada clúster tiene. Por lo tanto, para cualquier imagen con cualquier número de funciones SIFT, tiene un histograma de 200 bins. Ese es su vector de características que le da al SVM. (Tenga en cuenta que el término características está muy sobrecargado).
Según recuerdo, se realizó un gran trabajo en relación con la forma en que estos histogramas deberían normalizarse. Podría estar equivocado, pero parece recordar un artículo que afirmaba que un vector de características binarias (es decir, 1 si al menos 1 característica de este grupo está presente, y 0 en caso contrario) funcionó mejor que un histograma. Tendría que consultar la literatura para obtener detalles, y los detalles son importantes.
Editar: La Caja de herramientas del sistema de visión por computadora para MATLAB ahora ofrece la funcionalidad de la bolsa de características .