Estoy buscando recomendaciones sobre las mejores prácticas para tratar con capas de datos ráster con diferentes resoluciones y proyecciones. El consejo que me han dado es que siempre vuelva a muestrear la capa con la resolución más baja antes de realizar cualquier análisis, pero esto me parece una gran pérdida de precisión y nunca me han dado una explicación sólida de por qué debería hacerse.
¿Cuándo es razonable volver a muestrear para que coincida con una cuadrícula de mayor resolución y cuáles son las implicaciones en comparación con el remuestreo a una resolución más baja?
Me doy cuenta de que esto es muy dependiente de la situación. Principalmente busco pautas generales, pero aquí está mi escenario específico para referencia:
Escenario: Estoy buscando construir un modelo de regresión espacial que prediga el uso de la tierra basado en una variedad de capas ambientales y socioeconómicas. Mi mapa de uso del suelo está derivado de Landsat y, por lo tanto, tiene una resolución de 30 m. Los ejemplos de capas explicativas incluyen el SRTM DEM (3 segundos de arco, ~ 90 m ) y las capas climáticas de Bioclim (30 segundos de arco, ~ 1 km).
fuente
Respuestas:
En realidad, no todo depende de esa situación y se trata de un error estadístico.
Cada vez que vuelve a muestrear a una resolución más alta, está introduciendo una precisión falsa. Considere un conjunto de datos medidos en pies solo con números enteros. Cualquier punto dado puede estar a +/- 0.5 pies de su ubicación real. Si vuelve a muestrear a la décima más cercana, ahora está diciendo que cualquier número dado no está a más de +/- 0.1 de su ubicación real. Sin embargo, sabe que sus mediciones originales no eran tan precisas y ahora está operando dentro del margen de error. Sin embargo, si va por el otro lado y vuelve a muestrear a la resolución más baja, sabrá que cualquier valor de punto dado es definitivamente preciso porque está contenido dentro del margen de error de la muestra más grande.
Fuera de las matemáticas estadísticas, el primer lugar que se me viene a la mente es la topografía. Las encuestas más antiguas solo especificaban los rodamientos hasta el medio minuto más cercano y las distancias hasta la décima de pie. Trazar un recorrido de límite con estas mediciones a menudo puede dar como resultado un cierre incorrecto (el punto inicial y el punto final deben ser los mismos pero no se miden) en pies. Las encuestas modernas van al menos al segundo y centésimo de pie más cercano. Los valores derivados (como el área de un lote) pueden verse afectados significativamente por la diferencia de precisión. El valor derivado en sí mismo también se puede dar como demasiado preciso.
En su caso de análisis, si vuelve a muestrear a la resolución más alta, sus resultados implicarán una precisión mucho mayor que los datos en los que se basan. Considere su SRTM a 90m. Por cualquier método que midan la elevación (promedio / máximo / retorno medio), la unidad más pequeña (píxel) que se puede diferenciar de sus vecinos es 90 m. Si vuelve a muestrear eso a 30 m, ya sea:
Por lo tanto, en ambos casos introduce una precisión falsa porque sus nuevas submuestras no se midieron realmente.
Pregunta relacionada: ¿Qué prácticas están disponibles para modelar la idoneidad de la tierra?
fuente