¿Existen conceptos o teorías estadísticas sobre cómo medir efectivamente la actualidad en los eventos recientes que tienen más peso que los anteriores? Estoy creando un modelo de regresión logística y me gustaría aplicar un ajuste a varios factores en función de los eventos recientes.
... o, ¿depende exclusivamente de mí idear una fórmula arbitraria?
Por ejemplo: uno de mis proyectos es predecir mediante regresión logística el rendimiento de los golfistas profesionales en los próximos torneos. Su forma reciente (cómo jugaron la semana pasada) es generalmente más importante que cómo jugaron hace seis meses. ¿Existen técnicas / enfoques específicos que aprovechen este concepto?
regression
logistic
TravisVOX
fuente
fuente
Respuestas:
No necesariamente tiene que ser arbitrario; podría, por ejemplo, asumir un descuento exponencial y buscar el coeficiente que tenga el mejor valor predictivo.
Es decir, a tiempot se podría decir que el peso wt−k∝pk o equivalente wt−k∝exp(−αk)
(dónde 0<p<1 y α>0 )
En lo anterior,p o α son parámetros libres, pero en lugar de elegirlos arbitrariamente, puede comparar su rendimiento predictivo en diferentes valores de p (o equivalente, a través de diferentes α ), tal vez mediante la comparación de sumas de cuadrados de errores de predicción de un paso adelante, o cualquier otro criterio (función de pérdida) que considere más valioso / interesante / útil.
Alternativamente, podría utilizar un enfoque similar, pero donde aplica alguna otra forma de descuento, como el descuento hiperbólico .
fuente