Determinar las mejores series de tiempo correlacionadas

8

Antes de preguntar, leí preguntas similares, pero ninguna de ellas condujo a respuestas satisfactorias para mi interés específico.

Quiero homogeneizar una serie de precipitaciones climáticas de la República Dominicana durante 64 años (1940-2003). Para eso, es realmente importante seleccionar una serie de referencia entre un grupo de candidatos.

Digamos que sjoes la serie base, para la cual quiero encontrar una buena serie de referencia; bani, plcy rason candidatos de referencia, porque están cerca de sjo. En el siguiente mapa, el punto rojo es la estación base, y los verdes son los candidatos de referencia:

Realicé tres análisis de correlación (realizados en R, función cor()), considerando estas variables mensuales: valor de precipitación bruta, diferencia normalizada y valores transformados con Box-Cox. Esas variables corresponden, respectivamente, a los campos que comienzan con p, diany pnorm.

La diferencia normalizada proviene del primer método de serie de diferencia (FDM), propuesto por Peterson, que consiste en: [PAGSmetrot-PAGSmetrot-1]/ /[PAGSmetrot+PAGSmetrot-1], dónde PAGSmetrot es el valor de precipitación para el mes metroy PAGSmetrot-1es la precipitación para el mismo mes 1 año antes. Seguí el comentario de Peterson y sus colegas (1998) , que dice que la FDM aplicada a la precipitación podría funcionar mejor usando la diferencia normalizada.

Como se puede ver en la página 1 de este archivo PDF , se calculó la correlación para toda la serie temporal (1940-2003). Para la precipitación bruta y los valores transformados de Box-Cox, banise correlaciona mejor con sjo(las celdas de fondo amarillas muestran el índice de correlación máximo). Tenga en cuenta que para la precipitación bruta, baniestá significativamente más correlacionado que otros. Para la diferencia normalizada, rasolo está un poco más correlacionada que el resto. Sin embargo, cada estación candidato tiene un índice de correlación estadísticamente significativa con sjoelα=.05 nivel de significación, lo que sugiere que CUALQUIERA de ellos podría usarse como una serie de referencia.

Esto es un poco confuso, por lo que no estaba satisfecho y decidí hacer un análisis más detallado, dividiendo la serie en intervalos de 5 años y evaluando la correlación entre series para las mismas 3 variables: precipitación bruta, diferencia normalizada y transformación de Box-Cox .

Las tablas de la página 2 a la 8 en el PDF muestran los resultados de estas correlaciones parciales; La última página resume las veces que cada estación ha tenido el valor de correlación máximo para cada variable. Como se puede ver, banies el valor correlacionado con mayor frecuencia para las 3 variables analizadas (en todos los casos, más de 7 veces de los doce períodos de 5 años analizados).

Con estos resultados, creo que banies el mejor candidato como serie de referencia sjo, pero no estoy seguro. ¿Está bien el análisis del período de cinco años? ¿Debo realizar algún otro análisis?

JoseRamon
fuente
Gracias @Nick por las correcciones, aprendí mucho de ellas. Lo siento, el inglés no es mi lengua materna.
JoseRamon
Me alegra ser de ayuda :) ¡Su trabajo ya era más claro que el de muchos hablantes nativos! Mis cambios fueron solo cosméticos y técnicos, no esenciales. ¡Bienvenido a CV BTW!
Nick Stauner
Las correlaciones son significativas, pero ¿son diferentes las diferencias entre estas correlaciones? si no, entonces no puede elegir una estación de referencia sobre otra en función de las correlaciones
Aksakal
Gracias @ Aksakal por tu comentario. Para todo el período analizado, y exclusivamente para precipitación bruta, 'sjo' (la serie base) tiene estos índices de correlación con candidatos de referencia: 0.650 con 'bani', 0.536 con 'plc' y 0.557 con 'ra'. ¿El índice más grande es significativamente mayor que el siguiente más correlacionado? Con respecto a las otras variables, la diferencia normalizada y la transformación de Box-Cox, la diferencia no es grande. ¿Debo aplicar otro análisis? ¿Qué me sugerirías?
JoseRamon
@JoseRamon, no puedo responder estas preguntas, tienes los datos. Puede ejecutar las pruebas estadísticas para ver si la diferencia es significativa
Aksakal

Respuestas:

1

¿qué tal si prueba una Anova de dos vías Y una prueba por pares, ya sea con sus datos anuales y / o los intervalos de 5 años? También puede hacer esto con los datos sin procesar y normalizados o con los datos de Box-Cox.

La idea es que puede buscar cualquier diferencia no significativa (para la estación de referencia) entre las distribuciones de precipitación por estación.

Encontré este enlace útil para comenzar su propio Anova de dos vías a través de R r-tutorial-series-two-way-anova

Sebastian

tester1234
fuente
Gracias Sebastian por tu respuesta. Probaré estas sugerencias, que me parecen muy útiles. Lo he usado en otra investigación y es muy poderoso.
JoseRamon
Hola de nuevo @ tester1234. Estoy tratando de realizar la prueba de Anova de dos vías para mis datos. Según el enlace que me sugirió: ¿cuáles deberían ser mis dos factores? ¿Puedo decir: qué variables debo poner dentro de la función 'lm ()'? Tengo precipitación de 3 estaciones (pbani, pplc, pra), y quiero saber cuál está mejor correlacionada con una cuarta (psjo). Tengo datos mensuales que se agrupan en intervalos de 5 años (los datos se pueden descargar desde este enlace ). Gracias de antemano
JoseRamon