Soy un estudiante de maestría, preparando un seminario en visión artificial. Entre los temas se encuentra el rastreador Kanade-Lucas-Tomasi (KLT), como se describe en
J. Shi, C. Tomasi, "Buenas características para rastrear" . Actas CVPR '94.
Aquí hay un recurso web que estoy usando para comprender el rastreador KLT. Necesito ayuda con las matemáticas, ya que estoy un poco oxidado en álgebra lineal y no tengo experiencia previa con visión por computadora.
En esta fórmula para (paso 5 en el resumen), observe la arpillera inversa:
En el artículo, las buenas características para rastrear se definen como aquellas en las que la suma de las matrices de Hesse inversas tienen valores propios grandes y similares: . No pude entender cómo y de dónde se deriva esto, matemáticamente.
La intuición es que esto representa un rincón; T entiendo eso. ¿Qué tiene que ver eso con los valores propios? Espero que si los valores del Hessian son bajos, no hay cambio, y no es una esquina. Si son altos, es una esquina. ¿Alguien sabe cómo la intuición de la esquina entra en juego en los valores propios de la arpillera inversa para determinar través de las iteraciones del rastreador KLT?
He podido encontrar recursos que afirman que la arpillera inversa se correlaciona con la matriz de covarianza de la imagen. Además, la covarianza de la imagen indica el cambio de intensidad, y entonces tiene sentido ... pero no he podido encontrar qué es exactamente una matriz de covarianza de imagen con respecto a una imagen, y no a un vector o una colección de imágenes.
Además, los valores propios tienen significado en el análisis de componentes principales, por lo que tengo la idea de una matriz de covarianza de imagen, pero no estoy seguro de cómo aplicar esto al hessiano, ya que generalmente se aplica a una imagen. El Hessian, hasta donde yo entiendo, es una matriz que define las segundas derivadas para , , y en una determinada ubicación .
Realmente agradecería ayuda con esto, ya que he estado en esto por más de 3 días, es solo una pequeña fórmula y el tiempo se acaba.
fuente
Respuestas:
Piense en ellos como términos de suavidad 2D.
Cuanto más suave sea el parche, menor será el rango de la matriz y más cerca estará la matriz de ser singular.
En un borde recto (no en una esquina), solo un valor propio será grande.
En una esquina ambos serán grandes.
El uso de valores propios significa que el ángulo del borde no es un factor, y en cualquier ángulo, un borde dará solo un gran ev
fuente