Tengo un viejo conjunto de datos vectoriales con polígonos que cubren un continente. Los datos se publicaron por primera vez en papel a escala 1: 5 000 000 y luego se digitalizaron. No tengo los datos originales y no tengo información sobre la vectorización o metadatos. Supongo que la distancia entre los vértices en lugar de la precisión limita la resolución.
Los vértices se guardan con alta resolución (por ejemplo, "nnn.nnnnnnnnn", "- nn.nnnnnnnnn"). El conjunto de datos tiene pocos puntos que se pueden georreferenciar ni ningún nodo que se defina como coordenadas (por ejemplo, en grados pares o coordenadas UTM). Cuando comparo algunas secciones de la costa, el error es de hasta +/- 20 km.
Me gustaría encontrar una fórmula para estimar el error máximo basado en la distribución de los vértices. Tengo acceso a cualquier aplicación SIG, pero preferiría una referencia estadística sólida.
¿Cómo puedo calcular el error máximo del conjunto de datos, suponiendo que todos los vértices son correctos? O redactado de manera diferente: ¿Qué método puedo usar para encontrar la resolución más grande del conjunto de datos?
Traté de rasterizar el conjunto de datos en diferentes tamaños de celda y luego sobremuestrearlo a un tamaño de celda pequeño para detectar la rasterización más pequeña posible sin pérdida de resolución, pero eso es un enfoque bastante lento y no muy matemático.
fuente
Respuestas:
Gran pregunta: he visto este tipo de preguntas aparecer varias veces y, desafortunadamente, muchas personas que realizan análisis cuantitativos de SIG ignoran el componente CRÍTICO de calcular la incertidumbre en los conjuntos de datos espaciales. Hay conceptos y terminología importantes que deben aclararse antes de que este tipo de tarea pueda resumirse en resultados cuantitativos.
El error de cálculo en un conjunto de datos espaciales supone un conocimiento previo del linaje de los conjuntos de datos. Como los metadatos no están disponibles en ningún paso del proceso, este tipo de cuantificación no es posible. La precisión de las coordenadas dentro de un conjunto de datos vectoriales no garantiza la afirmación de que el conjunto de datos es exacto en ningún grado. Rasterizar un conjunto de datos heredará su propio grado de error e incertidumbre dentro de los datos.
Sin los metadatos y el cálculo continuo de error e incertidumbre, el conjunto de datos puede considerarse una imagen bonita. Si bien puede parecer un proceso simple usar la escala del mapa original y la naturaleza precisa de las coordenadas del polígono vectorial, los conceptos fundamentales de la geografía se violarán si no se calcula el error y la incertidumbre en cada paso de la creación del conjunto de datos a partir de:
Aunque esta puede no ser la respuesta que está buscando, es un buen lugar para comenzar para cualquier persona en una situación similar:
Si tiene la tarea de calcular una representación cuantitativa precisa de la incertidumbre de un modelo espacial, le sugiero que investigue el tema "Incertidumbre y propagación de errores en datos espaciales", ya que el tema es profundo, matemático y estadísticamente denso.
Si está utilizando el conjunto de datos como una imagen bonita, comience a mapear.
fuente
Estoy de acuerdo con Alex, ya que no hay metadatos disponibles y no se conoce el linaje del conjunto de datos, es difícil evaluar el error. El error debe cuantificarse en una ubicación conocida precisa si existe en extensiones de conjunto de datos.
fuente