Supongamos que tengo las siguientes series temporales no periódicas. Obviamente, la tendencia está disminuyendo y me gustaría probarlo con alguna prueba (con valor p ). No puedo usar la regresión lineal clásica debido a una fuerte autocorrelación temporal (en serie) entre los valores.
library(forecast)
my.ts <- ts(c(10,11,11.5,10,10.1,9,11,10,8,9,9,
6,5,5,4,3,3,2,1,2,4,4,2,1,1,0.5,1),
start = 1, end = 27,frequency = 1)
plot(my.ts, col = "black", type = "p",
pch = 20, cex = 1.2, ylim = c(0,13))
# line of moving averages
lines(ma(my.ts,3),col="red", lty = 2, lwd = 2)
¿Cuáles son mis opciones?
r
time-series
Ladislav Naďo
fuente
fuente
frequency=1
) es poco relevante aquí. Un problema más relevante podría ser si está dispuesto a especificar una forma funcional para su modelo.Respuestas:
Como dijiste, la tendencia en tus datos de ejemplo es obvia. Si desea justificar este hecho mediante una prueba de hipótesis, además de usar la regresión lineal (la opción paramétrica obvia), puede usar la prueba no paramétrica de Mann-Kendall para la tendencia monotónica. La prueba se usa para
Además, como señaló Gilbert (1987), la prueba
En este hilo puedes encontrar el código R que implementa esta prueba.
Gilbert, RO (1987). Métodos estadísticos para el monitoreo de la contaminación ambiental. Wiley, Nueva York.
Önöz, B. y Bayazit, M. (2003). El poder de las pruebas estadísticas para la detección de tendencias. Revista turca de ingeniería y ciencias ambientales, 27 (4), 247-251.
fuente
El problema que tiene "No puedo usar la regresión lineal clásica debido a una fuerte autocorrelación temporal (en serie) entre los valores". Es en realidad una oportunidad. Tomé sus 27 valores y usé AUTOBOX un software (que he ayudado a desarrollar) que puede (opcionalmente) determinar automáticamente un posible modelo. Aquí está el gráfico real / ajuste y pronóstico . El ACF de los residuos está aquí con el gráfico residual aquí . El modelo está aquí y aquí y aquí.. Dos coeficientes describen adecuadamente los datos con una "tendencia" estimada, también conocida como "deriva", es decir, diferencial de período a período de -.596. Tenga en cuenta que este es un tipo de tendencia en la que su modelo utiliza los números de conteo 1,2, ... 27 como variable predictiva. Si sus datos sugirieran ese tipo de tendencia, entonces el software lo habría encontrado más aplicable. Trataré de encontrar una publicación anterior que detalla completamente / contrasta estos dos tipos de tendencias. Aquí Identificar un modelo de tendencia estocástica y detectar tendencias iniciales o valores atípicos
fuente
Puede usar el coeficiente de correlación de rango de Spearman para determinar el grado en que sus datos son monótonos. Devuelve valores positivos para datos monotónicos crecientes y valores negativos para datos monotónicos decrecientes (entre -1 y +1). Siguiendo el enlace de arriba, hay también una prueba de significación sección que trata, aunque estoy seguro de que la mayoría de los paquetes de software tendrán un valor de p hecho por usted cuando se calculan los coeficientes de correlación (por ejemplo, en Matlab:
[RHO,PVAL] = corr(...)
; en I:cor.test(x,...)
)fuente
Puede usar OLS porque no hay autocorrelación en serie (al menos en la muestra que proporcionó); observe la estadística de prueba de Durbin-Watson de 1.966 (≈2).
Entonces, la estimación del coeficiente significativamente negativo para x1 es todo lo que necesita decir algo como
o
Esto supone que la metodología para contar las especies tiene una buena cobertura y es consistente a lo largo de los años en su muestra.
Esto se produjo con este código de Python (lo siento; no tengo R a mano):
fuente
Conocer la fuente de datos sería muy útil, y también la información si los valores de
my.ts
podrían ser negativos o no.Sin embargo, al echar un vistazo rápido a la trama, en lugar de ver una tendencia lineal constante , sugiero que la serie temporal no es estacionaria, por lo tanto, está integrada . Como ejemplo, los precios de las acciones también están integrados, pero los rendimientos de las acciones ya no (fluctúan cerca de 0).
Esta hipótesis también se puede probar con la prueba de Dickey Fuller aumentada:
Dado que el valor p no es inferior a 0.05, no hay evidencia de que el proceso sea estacionario.
Para obtener los datos estacionarios, debe diferenciarlos:
Ahora los datos ya no muestran tendencia , y lo único que encontrará es un término autorregresivo de orden 2 (usando
acf(diff.ts)
).fuente