¿Determinando relaciones estadísticas entre rásteres usando R vs ArcGIS Desktop?

8

Estoy tratando de analizar cómo los conjuntos de rásteres se relacionan entre sí utilizando algunas técnicas estadísticas. Como no tengo mucha experiencia usando las herramientas de estadísticas espaciales en ArcGIS , estaba exportando mis rásteres como archivos Ascii y analizándolos usando R (específicamente el maptoolspaquete y readAsciiGrid()). Esto ha estado funcionando bien (pero como los conjuntos de datos tienen 90,000 puntos, es lento para ejecutar el análisis), pero no sé si estoy recreando en R , la funcionalidad existente en ArcGIS .

Por ejemplo, quiero realizar regresiones entre cada uno de estos rásteres utilizando algunas transformaciones diferentes (logarítmica, exponencial, etc.). ¿Se puede hacer esto dentro de ArcGIS ? Una segunda pregunta más amplia es si hay métodos estadísticos estándar para examinar este tipo de datos.

Cada par de ráster tiene valores coincidentes de datos / sin datos y todos los parámetros son idénticos, aparte del valor de la celda de cuadrícula.

djq
fuente

Respuestas:

9

Me apegaría a R. Si la velocidad es realmente un problema (dudo que 90,000 no sea un número tan grande), podría intentar encontrar relaciones entre un subconjunto de sus datos. En realidad, lo primero que haría es hacer un plan para buscar relaciones obvias.

Incluso si arcgis contiene herramientas para comparar rásteres, R siempre le dará muchas más herramientas estadísticas.

P.ej:

library(rgdal)
map1<-readGDAL('file.asc')
map2<-readGDAL('file2.asc')
samplenr<-sample(length(map1$band1), 1000)
smallset<-data.frame(map1=map1$band1[samplenr],map2=map2$band1[samplenr])
plot(smallset)
lm(map2~map1, smallset)
...

De hecho, debería agregar que a menudo es más correcto trabajar con un subconjunto de sus datos que con su conjunto de datos completo. En muchos casos, las celdas de la cuadrícula no son independientes de las celdas de datos circundantes, lo que dará como resultado valores p demasiado optimistas para, por ejemplo, ajustes de regresión (encontrará más información si busca descifrar).

johanvdw
fuente
2
+1. Ni ArcGIS ni, para el caso, ningún SIG proporcionará de forma nativa capacidades como R u otros paquetes estadísticos con todas las funciones. Sería una tontería que lo intentaran. Lo que podemos esperar, y ArcGIS parece estar en las primeras etapas, es que la plataforma SIG proporcione una integración eficiente con otras aplicaciones para el análisis estadístico y la visualización.
whuber
Es cierto: la velocidad no es realmente un problema. Se necesitan aproximadamente 10 segundos para cargar dos rásteres y 10-15 segundos por operación hasta el momento. Si mantengo las cosas en perspectiva, ¡he esperado tanto tiempo en ArcGIS para que sucedan cosas! Planeo usar más muestras, lo que eliminará cualquier leve retraso.
djq
4

Mire el paquete ráster R , fue diseñado con este tipo específico de problema en mente. Intenta mantener la menor cantidad de ráster en la memoria y realiza una serie de operaciones espaciales básicas: a través de GDAL puede manejar archivos de cuadrícula ESRI nativos, entre muchos otros formatos. La viñeta proporciona algunos buenos ejemplos de su uso.

scw
fuente
1

Acabo de leer sobre un paquete de ArcGIS 10 que es un complemento R. No he tenido la oportunidad de explorarlo por completo, pero podría ser posible modificar esto para hacer lo que describo anteriormente.

djq
fuente