En las interfaces de SLAM que utilizan el algoritmo de punto más cercano iterativo (ICP) para identificar la asociación entre dos nubes de puntos coincidentes, ¿cómo puede determinar si el algoritmo está atascado en un mínimo local y devuelve un resultado incorrecto?
El problema se define como la coincidencia de dos nubes de puntos que son ambas muestras de alguna estructura de superficie arbitraria, y las áreas muestreadas tienen una superposición de 0-100%, lo que se desconoce. Sé que la variante de ICP recortada funciona de forma iterativa tratando de determinar la superposición, pero incluso esta se puede atascar en un mínimo local.
Un enfoque ingenuo sería mirar el error cuadrático medio de los pares de puntos identificados. Pero sin alguna estimación del muestreo, esto parece un umbral arriesgado. En el manual del Leica Cyclone , sugieren una inspección manual del histograma de error de par. Si tiene una forma gaussiana, el ajuste es bueno. Si hay una caída lineal, el partido probablemente sea malo. Esto me parece plausible, pero nunca lo he visto usado en un algoritmo.
Respuestas:
La mayoría de los métodos simples de ICP utilizan un enfoque de tipo de mínimos cuadrados. Es común y más fácil modelar cuando se supone que un modelo de error gaussiano corrompe los datos de la nube de puntos. En este caso, el componente de ajuste menos cuadrado del algoritmo ICP produce un modelo de error gaussiano para sus parámetros de solución con varianza estimada.
Es decir, si tiene acceso a los errores después de la coincidencia, puede estimar un error gaussiano en los parámetros de su transformación de la misma manera que calcularía el error en cualquier otra regresión lineal.
fuente
En caso de que tenga alguna información de otros sensores disponibles (por ejemplo, odometría de los codificadores de rueda), puede usarla cuando la transformación de cuerpo rígido que sugiere el laserScanner esté muy lejos.
Recuerde que en las trayectorias largas el camino de la odometría diverge de la verdad del terreno, pero localmente es bastante preciso.
PD. Esta es una pregunta bastante interesante, así que háganos saber cómo lo hizo en caso de que realmente haya resuelto el problema.
fuente
Creo que el mejor enfoque sería utilizar un conjunto de datos que contenga una verdad fundamental. El conjunto de datos que se cita con mayor frecuencia en la literatura se describe en el documento "Un punto de referencia para la evaluación de los sistemas RGB-D SLAM". También describen algunas métricas para comparar su resultado de estimación de pose con la verdad básica. Espero que esto ayude. Feliz codificación
fuente