He notado en mi propio trabajo este patrón al examinar un correlograma espacial a diferentes distancias, emerge un patrón en forma de U en las correlaciones. Más específicamente, las fuertes correlaciones positivas en contenedores de pequeña distancia disminuyen con la distancia, luego alcanzan un pozo en un punto particular y luego vuelven a subir.
Aquí hay un ejemplo del blog Conservation Ecology, Macroecology playground (3) - Autocorrelación espacial .
Estas auto correlaciones positivas más fuertes a distancias más grandes violan teóricamente la primera ley de geografía de Tobler, por lo que esperaría que fuera causada por algún otro patrón en los datos. Esperaría que lleguen a cero a una cierta distancia y luego se sitúen alrededor de 0 a distancias más largas (que es lo que generalmente ocurre en los gráficos de series de tiempo con un orden AR o MA de bajo orden).
Si realiza una búsqueda de imágenes en Google , puede encontrar algunos otros ejemplos de este mismo tipo de patrón (consulte aquí para ver otro ejemplo). Un usuario en el sitio SIG ha publicado dos ejemplos en los que el patrón aparece para Moran's I pero no aparece para Geary's C ( 1 , 2 ). En conjunto con mi propio trabajo, estos patrones son observables para los datos originales, pero cuando se ajusta un modelo con términos espaciales y se verifican los residuos, no parecen persistir.
No he encontrado ejemplos en el análisis de series de tiempo que muestren un gráfico ACF de aspecto similar, por lo que no estoy seguro de qué patrón en los datos originales causaría esto. Scortchi en este comentario especula que un patrón sinusoidal puede ser causado por un patrón estacional omitido en esa serie de tiempo. ¿Podría el mismo tipo de tendencia espacial causar este patrón en un correlograma espacial? ¿O es algún otro artefacto de la forma en que se calculan las correlaciones?
Aquí hay un ejemplo de mi trabajo. La muestra es bastante grande, y las líneas grises claras son un conjunto de 19 permutaciones de los datos originales para generar una distribución de referencia (por lo que se puede ver que la variación en la línea roja es bastante pequeña). Entonces, aunque la trama no es tan dramática como la primera que se muestra, el pozo y luego se elevan a mayores distancias aparecen con bastante facilidad en la trama. (También tenga en cuenta que el pozo en el mío no es negativo, como lo son los otros ejemplos, si eso materialmente hace que los ejemplos sean diferentes, no lo sé).
Aquí hay un mapa de densidad del núcleo de los datos para ver la distribución espacial que produjo dicho correlograma.
fuente
Respuestas:
Explicación
Un correlograma en forma de U es una ocurrencia común cuando su cálculo se lleva a cabo en toda la extensión de la región en la que ocurre un fenómeno. Aparece particularmente con fenómenos similares a la pluma en la naturaleza, como la contaminación localizada en suelos o aguas subterráneas o, como en este caso, donde el fenómeno está asociado con una densidad de población que generalmente disminuye hacia el límite del área de estudio (el Distrito de Columbia, que tiene un núcleo urbano de alta densidad y está rodeado de suburbios de baja densidad).
Recuerde que el correlograma resume el grado de similitud de todos los datos de acuerdo con su cantidad de separación espacial. Los valores más altos son más similares, los valores más bajos son menos similares. Los únicos pares de puntos en los que se puede lograr la mayor separación espacial son los que se encuentran en lados diametralmente opuestos del mapa. Por lo tanto, el correlograma está comparando valores a lo largo del límite entre sí. Cuando los valores de los datos tienden a disminuir en general hacia el límite, el correlograma solo puede comparar valores pequeños con valores pequeños. Es probable que los encuentre muy similares.
Por lo tanto, para cualquier fenómeno similar a un penacho u otro fenómeno espacialmente unimodal, podemos anticipar antes de recopilar los datos que el correlograma probablemente disminuirá hasta alcanzar aproximadamente la mitad del diámetro de la región y luego comenzará a aumentar.
Un efecto secundario: la variabilidad de la estimación.
Un efecto secundario es que hay más pares de puntos de datos disponibles para estimar el correlograma a distancias cortas que a distancias más largas. A distancias medias a largas, las "poblaciones de retraso" de tales pares de puntos disminuyen. Esto aumenta la variabilidad del correlograma empírico. Algunas veces esta variabilidad por sí sola creará patrones inusuales en el correlograma. Evidentemente, se usó un gran conjunto de datos en la figura superior ("Moran's I"), lo que reduce este efecto, pero no obstante, el aumento en la variabilidad es evidente en las amplitudes más grandes de las fluctuaciones locales en el gráfico a distancias más allá de 3500 aproximadamente: exactamente la mitad del distancia máxima
Por lo tanto, una regla general de larga data en las estadísticas espaciales es evitar calcular el correlograma a distancias superiores a la mitad del diámetro del área de estudio y evitar el uso de distancias tan grandes para la predicción (como la interpolación).
¿Por qué la periodicidad espacial no es la respuesta completa?
La literatura sobre estadísticas espaciales de hecho señala que los patrones espaciales periódicos pueden causar un rebote en el correlograma a distancias más grandes. Los geólogos mineros llaman a esto el "efecto agujero". Existe una clase de variogramas que incorporan un término sinusoidal para modelarlo. Sin embargo, todos estos variogramas imponen también una fuerte disminución con la distancia y, por lo tanto, no pueden explicar el retorno extremo a la correlación completa que se muestra en la primera figura. Además, en dos o más dimensiones es imposible que un fenómeno sea tanto isotrópico (en el que los correlogramas direccionales son todos iguales) como periódico. Por lo tanto, la periodicidad de los datos por sí sola no tendrá en cuenta lo que se muestra.
Qué se puede hacer
La forma correcta de proceder en tales circunstancias es aceptar que el fenómeno no es estacionario y adoptar un modelo que lo describa en términos de alguna forma determinista subyacente , una "deriva" o "tendencia", con fluctuaciones adicionales alrededor de esa deriva. que puede tener autocorrelación espacial (y temporal). Otro enfoque de los datos, como los recuentos de delitos, es estudiar una variable relacionada diferente, como el delito por unidad de población.
fuente