Por dónde empezar: series de tiempo desigualmente espaciadas, con muchos valores atípicos o aleatoriedad

8

Realmente no sé qué es posible, y me gustaría un puntero en la dirección correcta.

Tengo medidas de tiempo y posición que pueden ser cualquier cosa, desde una persona caminando, un vehículo en una carretera, un estacionamiento o una impresora en una oficina. Necesito calcular los tiempos de viaje para vehículos entre dos puntos. Puede ser que tomen una ruta serpenteante, o incluso tarden días en llegar de A a B. O pueden ser peatones o un vehículo de servicio de emergencia.

Quiero el tiempo de viaje estimado para un vehículo normal a lo largo de la ruta principal.

Las detecciones son cuando alguien está lo suficientemente cerca del detector, que tiene un radio particular. A veces hay muy pocas detecciones, lo que probablemente significa que el camino está vacío y que el tiempo de viaje sería bueno, aunque podría indicar que el camino está cerrado, y que el tiempo de viaje sería terrible. O podría haber muchas detecciones que muestran que el tráfico no se mueve, y podría estar haciendo cola para apagar la carretera, pero otros vehículos están viajando a velocidades normales.

Las tramas se ven como ruido aleatorio.

EDITAR:

En este momento estoy mirando dos métodos:

  1. Use el rango intercuartil para descartar valores atípicos
  2. Utiliza un filtro de Kalman.

Creo que el filtro es el camino equivocado, ya que no tengo un modelo para el tiempo de viaje que no sea de un momento a otro, no espero que cambie mucho.

Peter Wood
fuente
1
Esto parece un trabajo que requiere un trabajo metodológico en Annals of Applied Statistics y un trabajo sustantivo en Journal of Transportation Research . No debe esperar que la comunidad escriba ambos documentos para usted ni en las respuestas ni en los comentarios, y preferiría buscar la colaboración de un estadístico o economista de transporte. O arroje esto a un estudiante graduado en estadística o economía como tema de disertación.
StasK
2
@StasK No esperaba que la comunidad escribiera documentos para mí, pedí sugerencias en la dirección correcta. Sin embargo, gracias por dejarme saber que esta es una tarea sustancial.
Peter Wood
Creo que es, eso es todo lo que quería decir. Si tiene intervalos de tiempo desiguales, es posible que desee considerar el uso de modelado de variogramas y kriging, que generalmente se consideran herramientas de estadísticas espaciales.
StasK
@StasK No creo que kriging y variogramas sean lo que necesito. La geometría de la ruta entre dos puntos es relativamente desconocida y no tiene importancia en el tipo de resultados que estamos buscando. Tenemos dos puntos con detecciones en cada punto, y muchas detecciones de viaje falsas. Queremos filtrar el ruido y obtener una buena estimación de las condiciones actuales e históricas de la carretera. Muchas gracias por su interes.
Peter Wood

Respuestas:

1

No sé si puedo darle una respuesta esperada, pero creo que algún enfoque bayesiano sería bueno en este caso.

Es posible que desee echar un vistazo a los filtros de partículas en lugar de Kalman, ya que sospecho que puede ser un problema configurar el modelo correcto para el filtro de Kalman en este caso. Si desea utilizar Kalman, existen diferentes tipos de filtro y algunos de ellos requieren un buen conocimiento sobre la covarianza de errores, lo que puede causar problemas, pero algunos pueden calcularlo con Mante Carlo. Echa un vistazo a Kalman Filter sin perfume.

También le puede gustar http://www.udacity.com/overview/Course/cs373/CourseRev/apr2012, ya que explica algunas estimaciones básicas sobre la estimación de vehículos en movimiento y el automóvil autónomo de Google. (y está en python).

Quizás algunos detalles más en su pregunta serían más útiles y puede obtener respuestas más precisas.

tomasz74
fuente