¿Cómo crear un mapa de errores para admitir un mapa de densidad de kernel promedio?

10

He creado un mapa de densidad de kernel promedio ejecutando KDE en puntos apilados dentro de la misma extensión espacial. Por ejemplo, supongamos que tenemos archivos de formas de tres puntos que representan plántulas en tres huecos forestales diferentes de la misma forma y tamaño. Ejecuté un KDE para cada archivo de forma de punto. La salida del KDE se apilan basa en extensión espacial con el fin de calcular el promedio en calculadora raster de arco, por ejemplo: Float(("KDE1"+"KDE2"+"KDE3")/3). Aquí está el producto final:

ingrese la descripción de la imagen aquí

Ahora estoy interesado en crear un mapa que represente el error asociado con los KDE promediados. Espero usar el mapa de errores para representar visualmente cuánto error está asociado con los puntos de acceso (por ejemplo, ¿el punto de acceso SW se debe completamente a los puntos en un espacio?). ¿Cómo debo crear un mapa del error asociado con los KDE promediados? ¿Sería MSE la medida de error más apropiada en este caso?

Aaron
fuente
3
Es un análisis muy interesante. ¿Qué quiere decir con "error estándar"? ¿Algún tipo de desviación (diferencia) de cada mapa de densidad de la capa "media"?
Análisis del paisaje
@Landscape Analysis Post editado para abordar los comentarios. Sí, estoy pensando que una estimación de MSE podría ser más apropiada en este caso. Esencialmente, muestra cómo cada KDE diverge del KDE promedio. Sin embargo, no estoy seguro de cómo armar todo esto usando ArcGIS y / o scripting.
Aaron

Respuestas:

8

Una advertencia

Un error estándar es una forma útil de estimar una incertidumbre de los datos muestreados cuando no hay un error sistemático en los datos. Esa suposición es de dudosa validez en este contexto, porque (a) los mapas de KDE tendrán localmente errores definidos que pueden persistir sistemáticamente entre las capas y (b) un componente potencialmente enorme de incertidumbre debido a la elección del radio del núcleo (o "ancho de banda" ") no se reflejará en absoluto en ninguna colección de estos mapas.

Algunas opciones

Sin embargo, representar la variabilidad entre una colección de mapas relacionados, colocados ("apilados") es una gran idea, siempre que recuerde las limitaciones que acabamos de describir. Varias medidas de variabilidad local serían naturales en este entorno, incluyendo:

  • El rango de valores, expresados ​​ya sea de forma aditiva (máximo menos mínimo) o multiplicativamente (máximo dividido por mínimo).

  • La varianza o desviación estándar de los valores. La versión multiplicativa de esto sería la varianza o la desviación estándar de los logaritmos de los valores.

  • Un estimador robusto de dispersión, como el rango intercuartil (o la relación del tercer cuartil al primer cuartil).

En muchos aspectos, las medidas multiplicativas pueden ser más apropiadas para las densidades, porque la diferencia entre (digamos) 100 y 101 árboles por acre puede ser intrascendente, mientras que la diferencia entre 2 y 1 árboles por acre podría ser relativamente importante. Ambos exhiben el mismo rango (aditivo) de 101 - 100 = 2 - 1 = 1, pero sus rangos multiplicativos de 1.01 y 2.00 difieren sustancialmente. (Observe que un rango multiplicativo siempre excede 1, de modo que 2.00 está cien veces más alejado de 1 que 1.01).

Cálculo

Calcular estas medidas requiere alguna forma de estadísticas locales. La funcionalidad de estadísticas de celda en Spatial Analyst calculará las variaciones, los rangos y las desviaciones estándar. Los cuantiles locales se pueden encontrar con rango . En lugar de ser quisquilloso con respecto a los rangos que debe usar, elija los más convenientes cerca de los cuartiles. Para encontrarlos, n sea ​​el número de cuadrículas en la pila. La mediana tiene un rango de (n + 1) / 2, que podría no ser un número entero, lo que indica que debe calcularse promediando los rangos n / 2 y n / 2 + 1, cualquiera de los cuales se aproximaría a la mediana. Para aproximar los cuartiles, entonces, redondea (n + 1) / 2 al número entero más cercano, luego suma nuevamente 1 y divide entre 2. Deja que este número sea r . Utilizarr y n + 1 - r para las filas de los cuartiles.

Como ejemplo, si la pila tiene n = 6 cuadrículas, (n + 1) / 2 redondeado hacia abajo es 3 y (3 + 1) / 2 = 2 no necesita redondeo. Use r = 2 y r = 6 + 1 - 2 = 5 para los rangos. En efecto, este procedimiento devolvería el segundo valor más bajo ( r = 2) y el segundo valor más alto ( r = 5) de los seis valores en cada celda. Podrías mapear su diferencia o su relación.

whuber
fuente
2
Me imagino que el coeficiente de variación sería útil en este contexto.
Jeffrey Evans el
1
@ Jeffrey Gracias, eso también es una consideración. El CV se obtiene dividiendo la cuadrícula de desviación estándar (local) por la cuadrícula media (local). No lo mencioné, pero para tales resúmenes multiplicativos, se debe tener cuidado de enmascarar las áreas donde el denominador (la media o el mínimo, según sea el caso) es cercano a cero: los resultados pueden no ser confiables allí y probablemente no reflejará nada más que imprecisión numérica y pequeñas inexactitudes en la aproximación de los núcleos.
whuber
@whuber, ¿podrías dar más detalles sobre (a) en tu primer párrafo? Por ejemplo, ¿se refiere a errores en las técnicas de recopilación de datos que pueden persistir en cada brecha forestal (y, por lo tanto, manifestarse sistemáticamente en cada ráster KDE), o errores vinculados a la implementación de la función focal?
MannyG el
@whuber Grandes ideas por todas partes - muchas gracias!
Aaron