¿Una forma más sencilla de calcular la media móvil ponderada exponencialmente?

Método propuesto:

Dada una serie temporal , quiero calcular un promedio móvil ponderado con una ventana de promedio de puntos, donde las ponderaciones favorecen valores más recientes sobre valores más antiguos. $x_i$ $N$

Al elegir los pesos, estoy usando el hecho familiar de que una serie geométrica converge a 1, es decir, , siempre que se tomen infinitos términos. $\sum (\frac{1}{2})^k$

Para obtener un número discreto de pesos que sumen la unidad, simplemente tomo los primeros términos de la serie geométrica , y luego normalizo por su suma. $N$ $(\frac{1}{2})^k$

Cuando , por ejemplo, esto da los pesos no normalizados $N=4$

0.0625  0.1250  0.2500  0.5000

que, después de normalizar por su suma, da

0.0667  0.1333  0.2667  0.5333

El promedio móvil es simplemente la suma del producto de los 4 valores más recientes contra estos pesos normalizados.

Este método se generaliza de manera obvia para mover ventanas de longitud , y parece computacionalmente fácil también. $N$

Pregunta:

¿Hay alguna razón para no usar esta forma simple de calcular un promedio móvil ponderado usando 'pesos exponenciales'?

Pregunto porque la entrada de Wikipedia para EWMA parece más complicada. Lo que me hace preguntarme si la definición de libro de texto de EWMA quizás tenga algunas propiedades estadísticas que la definición simple anterior no tiene. ¿O son de hecho equivalentes?

time-series forecasting algorithms weighted-mean Assad Ebrahim
fuente

¿Cómo normalizaste la suma? ¿Podría describir el método que ha elegido? No está muy claro en la publicación. que, después de normalizar por su suma, da 0.0667 0.1333 0.2667 0.5333

Para empezar, está asumiendo 1) que no hay valores inusuales ni cambios de nivel, ni tendencias temporales ni variables ficticias estacionales; 2) que el promedio ponderado óptimo tiene pesos que caen en una curva suave que se puede describir con 1 coeficiente; 3) que la varianza del error es constante; que no hay series causales conocidas; ¿Por qué todos los supuestos?

IrishStat

@ Ravi: En el ejemplo dado, la suma de los primeros cuatro términos es 0.9375 = 0.0625 + 0.125 + 0.25 + 0.5. Entonces, los primeros cuatro términos contienen ~ 93.8% del peso total (6.2% está en la cola truncada). Use esto para obtener pesos normalizados que sumen la unidad al reescalar (dividir) entre 0.9375. Esto da 0.06667, 0.1333, 0.2667, 0.5333.

Assad Ebrahim

@IrishStat Es mejor no alejar a las personas del sitio en comentarios o respuestas, ya que los consejos que da fuera del sitio no están relacionados con la pregunta y, por lo tanto, no ayudan a los lectores posteriores (por ejemplo, vea la razón 1 de la respuesta principal aquí ); Si es un consejo adecuado, por lo general debería estar aquí.

Glen_b -Reinstate Monica

Explicación detallada de EWMA: mathematical-modeling-python.blogspot.dk/2013/11/...

tashuhka

Respuestas:

Descubrí que calcular promedios de carrera ponderados exponencialmente usando , es $\overline{x} \leftarrow \overline{x} + \alpha (x - \overline{x})$ $\alpha<1$

un método simple de una línea,
eso es fácilmente, aunque solo aproximadamente, interpretable en términos de un "número efectivo de muestras" (compare este formulario con el formulario para calcular el promedio móvil), $N=\alpha^{-1}$
solo requiere el dato actual (y el valor medio actual), y
Es numéricamente estable.

Técnicamente, este enfoque incorpora toda la historia en el promedio. Las dos ventajas principales de usar la ventana completa (en oposición a la truncada que se analiza en la pregunta) son que en algunos casos puede facilitar la caracterización analítica del filtrado y reduce las fluctuaciones inducidas si se producen datos muy grandes (o pequeños) El valor es parte del conjunto de datos. Por ejemplo, considere el resultado del filtro si todos los datos son cero, excepto un dato cuyo valor es . $10^6$

Dave
fuente

Hola. ¿La fórmula que sugirió incluye todos los valores anteriores con pesos exponencialmente decrecientes? ¿Entonces se incluiría toda la serie temporal, no solo los puntos más recientes ? Refiriéndose al ejemplo planteado en la pregunta, ¿sugiere la configuración o para aproximar el promedio móvil de 4 puntos?

N

$N$

N = 4

$N=4$

α = 0.25

$\alpha=0.25$

α = 0.5

$\alpha=0.5$

Assad Ebrahim

Ok, eso tiene sentido. Por lo tanto, parece que en los casos en que los valores de la serie temporal pueden verse afectados por transitorios significativos a corto plazo que no tienen ninguna relación después de que haya transcurrido un cierto período de tiempo, puede ser ventajoso utilizar la EWMA truncada con

N

$N$ elegido para coincidir con esta característica de 'relevancia' de la información histórica. La EWMA truncada en este caso evitaría un

10^{6}

$10^6$ pico que tiene algún impacto en el resultado, incluso si ocurrió en el pasado reciente, siempre que ocurriera fuera de la región de relevancia de la información ... Aceptando su respuesta, ¡gracias!

Assad Ebrahim