Usaré el algoritmo de transformación de características invariantes de escala como ejemplo aquí. SIFT crea un espacio de escala basado en el filtrado gaussiano a escala de una imagen, y luego calcula la diferencia de los gaussianos para detectar posibles puntos de interés. Estos puntos se definen como los mínimos y máximos locales a través de la diferencia de gaussianos.
Se afirma que este enfoque es invariante de escala (entre otras variaciones desconcertantes). ¿Por qué es esto? No me queda claro por qué este es el caso.
Respuestas:
El término "escala-invariante" significa lo siguiente aquí. Digamos que tiene la imagen I , y ha detectado una característica (también conocida como un punto de interés) f en algún lugar (x, y) y en algún nivel de escala s . Ahora supongamos que tiene una imagen I ' , que es una versión a escala de I (por ejemplo, disminuida). Luego, si su detector de características es invariante de escala, debería poder detectar la característica correspondiente f ' en I' en la ubicación correspondiente (x ', y') y la escala correspondiente s ' , donde (x, y, s) y (x ', y', s ') están relacionados por la transformación de escala adecuada.
En otras palabras, si su detector invariante de escala ha detectado un punto característico correspondiente a la cara de alguien, y luego acerca o aleja con su cámara en la misma escena, aún debe detectar un punto característico en esa cara.
Por supuesto, también querría un "descriptor de características" que le permitiera hacer coincidir las dos características, que es exactamente lo que SIFT le ofrece.
Entonces, a riesgo de confundirlo aún más, hay dos cosas que son invariantes de escala aquí. Uno es el detector de puntos de interés DoG, que es invariante de escala, ya que detecta un tipo particular de características de imagen (blobs) independientemente de su escala. En otras palabras, el detector DoG detecta gotas de cualquier tamaño. La otra cosa invariante de escala es el descriptor de características, que es un histograma de orientación de gradiente, que se mantiene más o menos similar para la misma característica de imagen a pesar de un cambio en la escala.
Por cierto, la diferencia de gaussianos se usa aquí como una aproximación al filtro laplaciano de gaussianos.
fuente
La diferencia de los gaussianos no es invariante de escala. La escala SIFT (en grado limitado) es invariante porque busca DoG extremos en el espacio de escala, es decir, encontrar escala con DoG extrema tanto espacial como relativamente a escalas vecinas. Debido a que el resultado DoG se obtiene para esta escala fija (que no es una función de la escala de entrada), el resultado es independiente de la escala, es decir, invariante de escala.
fuente