He creado un mapa de densidad de kernel promedio ejecutando KDE en puntos apilados dentro de la misma extensión espacial. Por ejemplo, supongamos que tenemos archivos de formas de tres puntos que representan plántulas en tres huecos forestales diferentes de la misma forma y tamaño. Ejecuté un KDE para cada archivo de forma de punto. La salida del KDE se apilan basa en extensión espacial con el fin de calcular el promedio en calculadora raster de arco, por ejemplo: Float(("KDE1"+"KDE2"+"KDE3")/3)
. Aquí está el producto final:
Ahora estoy interesado en crear un mapa que represente el error asociado con los KDE promediados. Espero usar el mapa de errores para representar visualmente cuánto error está asociado con los puntos de acceso (por ejemplo, ¿el punto de acceso SW se debe completamente a los puntos en un espacio?). ¿Cómo debo crear un mapa del error asociado con los KDE promediados? ¿Sería MSE la medida de error más apropiada en este caso?
Respuestas:
Una advertencia
Un error estándar es una forma útil de estimar una incertidumbre de los datos muestreados cuando no hay un error sistemático en los datos. Esa suposición es de dudosa validez en este contexto, porque (a) los mapas de KDE tendrán localmente errores definidos que pueden persistir sistemáticamente entre las capas y (b) un componente potencialmente enorme de incertidumbre debido a la elección del radio del núcleo (o "ancho de banda" ") no se reflejará en absoluto en ninguna colección de estos mapas.
Algunas opciones
Sin embargo, representar la variabilidad entre una colección de mapas relacionados, colocados ("apilados") es una gran idea, siempre que recuerde las limitaciones que acabamos de describir. Varias medidas de variabilidad local serían naturales en este entorno, incluyendo:
El rango de valores, expresados ya sea de forma aditiva (máximo menos mínimo) o multiplicativamente (máximo dividido por mínimo).
La varianza o desviación estándar de los valores. La versión multiplicativa de esto sería la varianza o la desviación estándar de los logaritmos de los valores.
Un estimador robusto de dispersión, como el rango intercuartil (o la relación del tercer cuartil al primer cuartil).
En muchos aspectos, las medidas multiplicativas pueden ser más apropiadas para las densidades, porque la diferencia entre (digamos) 100 y 101 árboles por acre puede ser intrascendente, mientras que la diferencia entre 2 y 1 árboles por acre podría ser relativamente importante. Ambos exhiben el mismo rango (aditivo) de 101 - 100 = 2 - 1 = 1, pero sus rangos multiplicativos de 1.01 y 2.00 difieren sustancialmente. (Observe que un rango multiplicativo siempre excede 1, de modo que 2.00 está cien veces más alejado de 1 que 1.01).
Cálculo
Calcular estas medidas requiere alguna forma de estadísticas locales. La funcionalidad de estadísticas de celda en Spatial Analyst calculará las variaciones, los rangos y las desviaciones estándar. Los cuantiles locales se pueden encontrar con rango . En lugar de ser quisquilloso con respecto a los rangos que debe usar, elija los más convenientes cerca de los cuartiles. Para encontrarlos, n sea el número de cuadrículas en la pila. La mediana tiene un rango de (n + 1) / 2, que podría no ser un número entero, lo que indica que debe calcularse promediando los rangos n / 2 y n / 2 + 1, cualquiera de los cuales se aproximaría a la mediana. Para aproximar los cuartiles, entonces, redondea (n + 1) / 2 al número entero más cercano, luego suma nuevamente 1 y divide entre 2. Deja que este número sea r . Utilizarr y n + 1 - r para las filas de los cuartiles.
Como ejemplo, si la pila tiene n = 6 cuadrículas, (n + 1) / 2 redondeado hacia abajo es 3 y (3 + 1) / 2 = 2 no necesita redondeo. Use r = 2 y r = 6 + 1 - 2 = 5 para los rangos. En efecto, este procedimiento devolvería el segundo valor más bajo ( r = 2) y el segundo valor más alto ( r = 5) de los seis valores en cada celda. Podrías mapear su diferencia o su relación.
fuente