Error de raíz cuadrática media (RMS) generalmente aceptado para rectificar mapas topográficos
12
Esta es una consulta genérica sobre la práctica / estándar común para determinar los valores aceptables de RMS al georreferenciar mapas topográficos. ¿Hay un valor absoluto?
Alguna literatura sugiere que debería ser "menor o igual a 1/2 del lado de una celda que constituye la resolución total de la imagen".
No, no hay un valor absoluto para RMS , porque depende de la calidad del mapa georreferenciado, la calidad del mapa objetivo (base) y el propósito de la georreferenciación. En particular, cualquier consejo que relacione RMS con el tamaño de la celda está mal informado, porque el tamaño de la celda refleja la precisión en la representación digital de una imagen, mientras que el error RMS refleja la precisión promedio (suponiendo que el mapa base es perfectamente preciso). Aunque distinguir precisión y exactitud puede parecer una pedantería sin rumbo, confundirlos es un error básico con consecuencias prácticas.
Todo esto es bastante vago, así que veamos un ejemplo específico. Recientemente recibí una serie de capturas de pantalla de mapas que muestran ubicaciones de muestras de suelo. Para obtener coordenadas, planeé georreferenciar estas capturas de pantalla a un mapa base de ortofoto y luego digitalizar los puntos con digitalización de cara a cara. Entre las consideraciones estaban:
El mapa base de ortofoto tiene 0,3 m de tamaño de celda.
Las capturas de pantalla tienen un tamaño de celda de aproximadamente 2 m.
Las ubicaciones de las muestras de suelo no fueron estudiadas; se ubicaron "a simple vista" en el mapa cuando la muestra estaba en el campo. El cliente estimó que la precisión era de aproximadamente 3 m, pero 10 m es más probable.
Las capturas de pantalla tienen pocos detalles nítidos: son principalmente líneas de contorno, con fencelinas ocasionales (que no son claramente visibles en la ortofoto). Por lo tanto, establecer muchos enlaces buenos sería lento y propenso a errores.
Probablemente hubo cierta distorsión local en las capturas de pantalla, lo que significa que la alta precisión (bajo RMS) solo se puede lograr con transformaciones complejas.
Era importante digitalizar las ubicaciones de las muestras de suelo para que las distancias relativas fueran bastante precisas para los puntos cercanos, pero la precisión absoluta era innecesaria, porque un resultado del estudio sería obtener muchas más muestras de suelo que refinaran y hicieran más precisa esta encuesta preliminar.
Para obtener un RMS de la mitad del tamaño de celda más grande se requeriría una transformación polinómica de alto orden o deformación en una cuadrícula de puntos, lo que requiere establecer una red de alrededor de 50 a 100 buenos enlaces entre las imágenes: una a varias horas de trabajo cuidadoso, la mayoría probablemente, dada la dificultad de incluso encontrar enlaces visibles. Para obtener un RMS de la mitad del tamaño de celda más pequeño se requeriría un orden de magnitud más esfuerzo: días de trabajo. Sin embargo, para los fines del estudio, un RMS de 5 m sería más que suficiente. Esto se logró con 7 enlaces y una transformación afín, solo unos minutos de trabajo. Tenga en cuenta que este RMS es varias veces mayor que el mayor de los dos tamaños de celdas en las imágenes.
Este ejemplo ilustra cómo seguir ciegamente las malas reglas generales puede ser costoso . Preste atención primero a sus objetivos de calidad de datos; todo lo demás se desprende de ellos.
Absolutamente. No hay sustituto para el conocimiento y la intuición específicos del dominio. Como programador, nunca deja de sorprenderme que lo que debería ser un problema ideal para los SIG modernos, siga siendo en gran medida un arte computable. Las habilidades realmente no han cambiado en los últimos 100 años cuando una chispa brillante pensó en atornillar una cámara a un avión. Eso no es para menospreciar a Maning o su pregunta de ninguna manera, pero hay una razón por la cual los intérpretes de fotografía aérea de ambas guerras mundiales fueron tan altamente entrenados y por qué esas habilidades son tan relevantes hoy en día en ese momento.
MerseyViking
1
Excelente respuesta whuber! Sigo más o menos lo que estás diciendo y el ejemplo específico que citaste prácticamente lo logró. @ MerseyViking, creo que la pregunta es muy relevante ya que muchos colegas caen en esta trampa de la regla del pulgar.
Maning
Muy buena respuesta, pero no estoy de acuerdo con el hecho de que RMSE refleja la precisión pura. De hecho, incorpora tanto la varianza (precisión) del estimador como su sesgo (precisión).
radouxju
@radouxju Estoy de acuerdo: gracias por la aclaración.
whuber
4
El libro más cercano que tengo a mano: Sistemas de Información Geográfica en Arqueología dice que "depende de la escala de los mapas y el propósito al que se les está enviando", pero recomienda apuntar a un error menor que 1: 3000, entonces si el mapa original era 1: 15000, entonces un RMSE de 5m o menos sería aceptable. Ciertamente, cualquier cosa menos de 1/2 píxel sería en gran medida redundante, pero sería bueno tenerlo.
Si está combinando más de un mapa, entonces el RMSE final será la raíz cuadrada de la suma de los RMSE individuales, por lo que si un mapa de alta resolución no se comporta, pero sí uno de menor resolución, entonces puede que no sea Vale la pena gastar tiempo en conseguir que el primero encaje mejor
+1 buenos puntos. La justificación para 1: 3000 debe basarse en las necesidades de los estudios arqueológicos típicos. Esa regla no se traducirá en campos no relacionados.
whuber
3
Su pregunta tiene la respuesta que siempre he visto.
menos o igual a 1/2 del lado de una celda que conforman la resolución total de la imagen
Esta es una regla de oro. En la vida real, a veces he tenido que ser menos preciso que esto por varias razones:
No es factible alcanzar estos niveles, con la cantidad de mosaicos que tiene que rectificar.
El proyecto no requiere la precisión establecida por estas reglas (es decir, el uso de ellas es para un proyecto estratégico y no se realizarán mediciones de la salida.
Ha sido imposible alcanzar esto debido a la incapacidad de trazar un número suficiente de puntos de control seguros.
El libro más cercano que tengo a mano: Sistemas de Información Geográfica en Arqueología dice que "depende de la escala de los mapas y el propósito al que se les está enviando", pero recomienda apuntar a un error menor que 1: 3000, entonces si el mapa original era 1: 15000, entonces un RMSE de 5m o menos sería aceptable. Ciertamente, cualquier cosa menos de 1/2 píxel sería en gran medida redundante, pero sería bueno tenerlo.
Si está combinando más de un mapa, entonces el RMSE final será la raíz cuadrada de la suma de los RMSE individuales, por lo que si un mapa de alta resolución no se comporta, pero sí uno de menor resolución, entonces puede que no sea Vale la pena gastar tiempo en conseguir que el primero encaje mejor
fuente
Su pregunta tiene la respuesta que siempre he visto.
Esta es una regla de oro. En la vida real, a veces he tenido que ser menos preciso que esto por varias razones:
fuente