Tengo muchas series de tiempo con períodos: día, semana o mes. Con stl()
función o con loess(x ~ y)
puedo ver cómo se ven las tendencias de series de tiempo particulares. Necesito detectar si la tendencia de las series temporales está aumentando o disminuyendo. ¿Cómo puedo manejar eso?
Traté de calcular los coeficientes de regresión lineal con lm(x ~ y)
y jugar con el coeficiente de pendiente. ( If |slope|>2 and slope>0 then
tendencia creciente, else if |slope|>2 and slope<0
- decreciente). ¿Quizás haya otro método más efectivo para la detección de tendencias? ¡Gracias!
Por ejemplo: Tengo timeserie1
, timeserie2
. Necesito un algoritmo simple que me diga que timeserie2
es un algoritmo creciente, y que timeserie1
, en la tendencia, no está aumentando o disminuyendo. ¿Qué criterios debo usar?
timeserie1
:
1774 1706 1288 1276 2350 1821 1712 1654 1680 1451 1275 2140 1747 1749 1770 1797 1485 1299 2330 1822
1627 1847 1797 1452 1328 2363 1998 1864 2088 2084 594 884 1968 1858 1640 1823 1938 1490 1312 2312
1937 1617 1643 1468 1381 1276 2228 1756 1465 1716 1601 1340 1192 2231 1768 1623 1444 1575 1375 1267
2475 1630 1505 1810 1601 1123 1324 2245 1844 1613 1710 1546 1290 1366 2427 1783 1588 1505 1398 1226
1321 2299 1047 1735 1633 1508 1323 1317 2323 1826 1615 1750 1572 1273 1365 2373 2074 1809 1889 1521
1314 1512 2462 1836 1750 1808 1585 1387 1428 2176 1732 1752 1665 1425 1028 1194 2159 1840 1684 1711
1653 1360 1422 2328 1798 1723 1827 1499 1289 1476 2219 1824 1606 1627 1459 1324 1354 2150 1728 1743
1697 1511 1285 1426 2076 1792 1519 1478 1191 1122 1241 2105 1818 1599 1663 1319 1219 1452 2091 1771
1710 2000 1518 1479 1586 1848 2113 1648 1542 1220 1299 1452 2290 1944 1701 1709 1462 1312 1365 2326
1971 1709 1700 1687 1493 1523 2382 1938 1658 1713 1525 1413 1363 2349 1923 1726 1862 1686 1534 1280
2233 1733 1520 1537 1569 1367 1129 2024 1645 1510 1469 1533 1281 1212 2099 1769 1684 1842 1654 1369
1353 2415 1948 1841 1928 1790 1547 1465 2260 1895 1700 1838 1614 1528 1268 2192 1705 1494 1697 1588
1324 1193 2049 1672 1801 1487 1319 1289 1302 2316 1945 1771 2027 2053 1639 1372 2198 1692 1546 1809
1787 1360 1182 2157 1690 1494 1731 1633 1299 1291 2164 1667 1535 1822 1813 1510 1396 2308 2110 2128
2316 2249 1789 1886 2463 2257 2212 2608 2284 2034 1996 2686 2459 2340 2383 2507 2304 2740 1869 654
1068 1720 1904 1666 1877 2100 504 1482 1686 1707 1306 1417 2135 1787 1675 1934 1931 1456 1363 2027
1740 1544 1727 1620 1232 1199
timeserie2
:
122 155 124 97 155 134 115 122 162 115 102 163 135 120 139 160 126 122 169 154
121 134 143 100 121 182 139 145 135 147 60 58 153 145 130 126 143 129 98 171
145 107 133 115 113 96 175 128 106 117 124 107 114 172 143 111 104 132 110 80
159 131 113 123 123 104 101 179 127 105 133 127 101 97 164 134 124 90 110 102
90 186 79 145 130 115 79 104 191 137 114 131 109 95 119 173 158 137 128 119
109 120 182 140 133 113 121 110 122 159 129 124 119 109 108 95 167 138 125 105
139 118 115 166 140 112 116 139 121 109 164 135 118 121 112 111 102 169 136 151
132 135 130 112 156 134 121 116 114 91 86 141 160 116 118 112 84 114 165 141
109 123 122 110 100 162 145 121 118 115 107 103 162 142 130 139 134 121 118 164
147 125 120 134 107 130 158 141 144 148 124 135 118 212 178 154 167 155 176 143
201 170 144 138 152 136 123 223 189 160 153 190 136 144 276 213 199 211 196 170
179 460 480 499 550 518 493 557 768 685 637 593 507 611 569 741 635 563 577 498
456 446 677 552 515 441 438 462 530 699 629 555 641 625 544 585 705 584 553 622
506 500 533 777 598 541 532 513 434 510 714 631 1087 1249 1102 913 888 1147 1056 1073
1075 1136 927 922 1066 1074 996 1189 1062 999 974 1174 1097 1055 1053 1097 1065 1171 843 441
552 779 883 773 759 890 404 729 703 810 743 743 946 883 813 876 841 742 715 960
862 743 806 732 669 621
fuente
Respuestas:
Puede aplicar un filtro de cambio de fase cero y cortar todas las frecuencias más altas que algún umbral; esto le daría una especie de "tendencia".
Por ejemplo, mire esta pregunta, " ¿Cómo ejecuto un filtro de paso alto o de paso bajo en los puntos de datos en R? " Muestran cómo usar el filtro de paso bajo de Butterworth. El problema con ese filtro es que no es un cambio de fase cero, es decir, como puede ver, la fase del componente de baja frecuencia se desplaza en relación con la señal original. Es posible que desee encontrar el filtro que no cambia la fase. Si se tratara de datos económicos, sugeriría el filtro de Christiano según "The Band Pass Filter" de Lawrence J. Christiano y Terry J. Fitzgerald (1999). Para los datos físicos, debe haber una tonelada de filtros de cambio de fase cero disponibles.
ACTUALIZAR:
Aquí hay un ejemplo de cómo aplicar el filtro de paso de banda baja al LOG de la segunda serie de tiempo. Se requiere el LOG para igualar la varianza.
ACTUALIZACIÓN2:
Aquí hay una muestra de descomposición en el dominio de frecuencia con bandas de frecuencia: irregular [2-19], cíclica [20-99] y tendencia [100- ] (en períodos). Las bandas de frecuencia deben elegirse cuidadosamente en función de la comprensión del fenómeno subyacente.∞
fuente
La detección de tendencias en una serie temporal se puede hacer simplemente mal o de forma más agresiva. Una serie puede tener valores que exhiben una tendencia, por ejemplo[1−B]y(t)=θ0+[MA/AR]a(t)
1,2,3,4,5
, y luego un cambio en la tendencia en uno o más puntos en el tiempo, por7,9,11,13,15,...
ejemplo , Otro ejemplo es1,1,1,1,1,2,3,4,5,6
donde no hay tendencia presente para las primeras 5 lecturas, y luego se produce una tendencia. Se1,1,1,1,1,2,2,2,2,2
dice que una serie como tiene un cambio de nivel (cambio en la intercepción). AUTOBOXes una pieza de software que únicamente (según mi conocimiento) incorpora análisis para detectar, probar e incorporar tendencias de tiempo. Fui uno de los desarrolladores y extendí el análisis en esta área en particular. El procedimiento que está intentando utilizar (incorrectamente en mi opinión) es el modelo presuntivo, es decir, sin pulsos, sin cambios de nivel, sin pulsos estacionales, sin estructura ARIMA, varianza de error constante, etc. Otro posible mal ejemplo de un modelo asumido es use , ya que de nuevo, uno está asumiendo una estructura particular.La idea aquí es que el modelo ARIMA podría ser incorrecto o que está cambiando (por lo tanto, diferentes tendencias) en diferentes momentos.θ0
La idea es dejar que los datos "hablen" y el análisis "escuche" y detecte el "modelo correcto" o al menos un "modelo útil".
Orson Bean, o tal vez fue alguien más, dijo una vez: "Una tendencia es una tendencia ... hasta que se dobla, y cuando la tendencia se dobla, la tendencia está terminando". Las tendencias de tiempo local en series de tiempo requieren la identificación de los puntos de ruptura y luego la estimación de la tendencia local. Puede encontrar algunos materiales / referencias útiles en http://www.autobox.com/OLDWEB/udontsay.html
Si desea publicar algunos datos, hágalo y le devolveré algunos resultados.
fuente