Actualmente estoy recopilando una lista de especímenes de bases de datos de varios museos de historia natural para futuras investigaciones. Sin embargo, un problema bien conocido asociado con la mayoría de los datos históricos es la falta de latitud y longitud apropiadas, lo que impide que uno use esos datos.
Ha habido formas de superar esos datos, como dibujar un búfer alrededor de una región y proporcionar un rango de incertidumbre asociado con esa ubicación.
Por ejemplo, la función - biogeomancer del paquete 'espacial' en R, automatiza el proceso de georreferenciación, siempre que haya algunas descripciones textuales como "2 millas al oeste de XYZ". Ver documentación aquí.
Sin embargo, mi principal preocupación es utilizar un protocolo de este tipo para regiones de hasta 200 km2. ¿Hay alguna manera de superar ese problema? Me encantaría usar este rico tesoro de datos del museo, siempre que pueda manejar la incertidumbre asociada con su ubicación.
A continuación se muestra un ejemplo de algunas muestras en mi conjunto de datos. Tenga en cuenta que muchos de ellos vienen con menciones de elevación, pero la mayoría de los registros son muy vagos.
EDITAR
En la sección de comentarios, uno de ustedes mencionó el propósito de esta pregunta y lo que tiendo a lograr de la misma.
1. Estoy interesado en cómo una vez puede reducir el radio de incertidumbre de una región poligonal realmente amplia a un radio de incertidumbre más pequeño (si es posible).
2. Esta información me ayudará a llevar a cabo análisis espaciales futuros, como el modelado de distribución de especies / modelado de ocupación, por ejemplo.
fuente
Respuestas:
Considere las fechas de los sucesos e intente obtener (construir, georreferenciar) un mapa de las carreteras, líneas ferroviarias, puentes y pueblos (pueblos, estaciones de tren) conocidos o disponibles en ese momento para la región, ya que los naturalistas generalmente partieron de un pueblo conocido y al menos parcialmente usa una carretera o ferrocarril existente para llegar a las áreas donde obtuvieron los especímenes. A veces realmente reduce el área probable de recolección / ocurrencia. Si hay más información ecológica sobre la especie, puede descartar áreas, por ejemplo. tierras abiertas vs forestales, humedales vs tierras secas, también con información complementaria sobre la distribución histórica de estos ecosistemas.
Aunque definitivamente no usaría estas ubicaciones para entrenar el modelo sdm, podría usar los resultados del modelo para reducir la incertidumbre de la ubicación de esas ocurrencias mal georreferenciadas en combinación con los datos mencionados anteriormente.
Algunos documentos recientes abordan el efecto de sesgo de estas ubicaciones inciertas y, si se usan datos ambientales resumidos, pueden usarse para compensar esta ubicación difusa:
¿Dónde es la incertidumbre posicional un problema para el modelo de distribución de especies? https://onlinelibrary.wiley.com/doi/pdf/10.1111/j.1600-0587.2013.00205.x
Cuantificación del grado de sesgo por el uso de datos a escala de condado en el modelado de distribución de especies: ¿Puede el aumento del tamaño de la muestra o el uso de datos ambientales promediados por el condado reducir la sobreprevisión distribucional? https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5551104/
fuente