Especímenes de museo de georreferenciación con descripciones de localidad pobres

10

Actualmente estoy recopilando una lista de especímenes de bases de datos de varios museos de historia natural para futuras investigaciones. Sin embargo, un problema bien conocido asociado con la mayoría de los datos históricos es la falta de latitud y longitud apropiadas, lo que impide que uno use esos datos.

Ha habido formas de superar esos datos, como dibujar un búfer alrededor de una región y proporcionar un rango de incertidumbre asociado con esa ubicación.

Por ejemplo, la función - biogeomancer del paquete 'espacial' en R, automatiza el proceso de georreferenciación, siempre que haya algunas descripciones textuales como "2 millas al oeste de XYZ". Ver documentación aquí.

Sin embargo, mi principal preocupación es utilizar un protocolo de este tipo para regiones de hasta 200 km2. ¿Hay alguna manera de superar ese problema? Me encantaría usar este rico tesoro de datos del museo, siempre que pueda manejar la incertidumbre asociada con su ubicación.

A continuación se muestra un ejemplo de algunas muestras en mi conjunto de datos. Tenga en cuenta que muchos de ellos vienen con menciones de elevación, pero la mayoría de los registros son muy vagos.

ingrese la descripción de la imagen aquí

EDITAR

En la sección de comentarios, uno de ustedes mencionó el propósito de esta pregunta y lo que tiendo a lograr de la misma.
1. Estoy interesado en cómo una vez puede reducir el radio de incertidumbre de una región poligonal realmente amplia a un radio de incertidumbre más pequeño (si es posible).
2. Esta información me ayudará a llevar a cabo análisis espaciales futuros, como el modelado de distribución de especies / modelado de ocupación, por ejemplo.

Vijay Ramesh
fuente
¿Has oído hablar de GBIF? gbif.org Puede que ya tenga lo que estás buscando.
GISKid
@GISKid Sí, estos son los datos de GBIF. Desafortunadamente, la mayoría de esos datos carece de una buena georreferenciación.
Vijay Ramesh
¡Interesante pregunta! Sin embargo, no está claro qué espera hacer: los elementos ya están georreferenciados en el sentido de que tienen información de ubicación, aunque para regiones poligonales. ¿Podría editar y ampliar cómo espera 'lidiar' con el tema de los polígonos grandes? ¿Es para ayudar con un análisis espacial?
Simbamangu
1
¿Qué método estás usando para tu SDM? ¿Y qué tamaño de área de estudio? Dependiendo de esos dos, yo pensaría que un área grande de incertidumbre reduciría la utilidad de un SDM, personalmente. En cambio, eliminaría los datos que tienen un gran polígono de incertidumbre y me apegaría al uso de ocurrencias que son 'más precisas'. Especialmente si el número de ocurrencias no es un problema
GISKid
2
Parece que podría limitar, caso por caso , algunos datos de localidad, por ejemplo, utilizando datos de elevación de ráster de 3500 '± 250' para enmascarar dentro del polígono de Santhapara. Sin usar 'habilidades de detective' y datos adicionales, está atrapado en tomar el centroide del polígono, y (hablando por experiencia) ¡esto es peligroso! ¿Por qué? Ahora tiene lo que parecen datos precisos de puntos, pero no lo son, y esto puede perderse durante el intercambio o los pasos de análisis.
Simbamangu

Respuestas:

2

Considere las fechas de los sucesos e intente obtener (construir, georreferenciar) un mapa de las carreteras, líneas ferroviarias, puentes y pueblos (pueblos, estaciones de tren) conocidos o disponibles en ese momento para la región, ya que los naturalistas generalmente partieron de un pueblo conocido y al menos parcialmente usa una carretera o ferrocarril existente para llegar a las áreas donde obtuvieron los especímenes. A veces realmente reduce el área probable de recolección / ocurrencia. Si hay más información ecológica sobre la especie, puede descartar áreas, por ejemplo. tierras abiertas vs forestales, humedales vs tierras secas, también con información complementaria sobre la distribución histórica de estos ecosistemas.

Aunque definitivamente no usaría estas ubicaciones para entrenar el modelo sdm, podría usar los resultados del modelo para reducir la incertidumbre de la ubicación de esas ocurrencias mal georreferenciadas en combinación con los datos mencionados anteriormente.

Algunos documentos recientes abordan el efecto de sesgo de estas ubicaciones inciertas y, si se usan datos ambientales resumidos, pueden usarse para compensar esta ubicación difusa:

¿Dónde es la incertidumbre posicional un problema para el modelo de distribución de especies? https://onlinelibrary.wiley.com/doi/pdf/10.1111/j.1600-0587.2013.00205.x

Cuantificación del grado de sesgo por el uso de datos a escala de condado en el modelado de distribución de especies: ¿Puede el aumento del tamaño de la muestra o el uso de datos ambientales promediados por el condado reducir la sobreprevisión distribucional? https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5551104/

Priscilla Minotti
fuente
Gracias por tu respuesta Priscilla. Actualmente estoy tratando de obtener mapas históricos de la cobertura del suelo y datos que brinden información sobre carreteras y municipios. La esperanza es hacer una referencia cruzada de esta información con etiquetas de especímenes de museos históricos para una mejor referencia geográfica de ellos. Si bien el aspecto SDM no es un problema importante, realmente me gustaría georreferenciarlos con precisión ya que quiero muestrear estos especímenes para el análisis genético. ¿Alguna idea sobre esto último?
Vijay Ramesh