Tengo 2 preguntas sobre el análisis de un conjunto de datos GPS.
1) Extracción de trayectorias Tengo una gran base de datos de coordenadas GPS registradas de la forma (latitude, longitude, date-time)
. De acuerdo con los valores de fecha y hora de registros consecutivos, estoy tratando de extraer todas las trayectorias / caminos seguidos por la persona. Por ejemplo; De vez en cuando M
, las (x,y)
parejas cambian continuamente hasta el tiempo N
. Después N
, el cambio en (x,y)
pares disminuye, en cuyo punto concluyo que el camino tomado de tiempo M
aN
se le puede llamar una trayectoria. ¿Es un enfoque decente a seguir al extraer trayectorias? ¿Existen enfoques / métodos / algoritmos bien conocidos que pueda sugerir? ¿Hay alguna estructura o formato de datos que quisiera sugerirme para mantener esos puntos de manera eficiente? Quizás, para cada trayectoria, ¿sería útil calcular la velocidad y la aceleración?
2) Minería de las trayectorias Una vez que tengo todas las trayectorias seguidas / rutas tomadas, ¿cómo puedo compararlas / agruparlas? Me gustaría saber si los puntos de inicio o final son similares, entonces, ¿cómo se comparan las rutas intermedias?
¿Cómo comparo los 2 caminos / rutas y concluyo si son similares o no? Además; ¿Cómo agrupo rutas similares?
Le agradecería mucho si me puede señalar una investigación o algo similar sobre este asunto.
El desarrollo será en Python, pero todo tipo de sugerencias de bibliotecas son bienvenidas.
Estoy abriendo exactamente la misma pregunta /programming/4910510/comparing-clustering-trajectories-gps-data-of-xy-points-and-mining-the-data en StackOverflow. Pensé que obtendría más respuestas aquí ...
fuente
Respuestas:
Dos artículos que probablemente le interesen, ya que tienen motivaciones similares a las suyas:
Límites de previsibilidad en la movilidad humana por: Chaoming Song, Zehui Qu, Nicholas Blumm, Albert-László Barabási. Science , vol. 327, núm. 5968. (19 de febrero de 2010), págs. 1018-1021.
Comprensión de los patrones individuales de movilidad humana por: Marta C.González, César A. Hidalgo, Albert-Laszlo Barabasi. Nature , vol. 453, núm. 7196. (05 de junio de 2008), págs. 779-782.
Tenga en cuenta que los dos estudios utilizan los mismos datos, que son similares a los suyos pero no al nivel de precisión en el espacio o el tiempo. No creo que describa lo que quieres encontrar como trayectoria, pero tampoco estoy seguro de cómo lo llamaría. ¿Por qué exactamente quiere agrupar los nodos de inicio / final de sus "trayectorias"?
fuente
PySAL: la biblioteca de análisis espacial de Python puede ser un buen comienzo: http://code.google.com/p/pysal/
Particularmente la sección de autocorrelación:
http://pysal.org/1.2/users/tutorials/autocorrelation.html
También podría considerar el uso de las bibliotecas R http://cran.r-project.org/web/views/Spatial.html para el análisis de patrones de puntos .
Otros paquetes R:
También puede simplificar el análisis si ajusta los puntos a las redes de transporte lineal existentes (carreteras / ferrocarril) disponibles en OSM. Luego, puede simbolizar según estas líneas y cuántas personas las usan en determinados momentos del día.
fuente
Si bien no puedo comentar mucho sobre las trayectorias o caminos de su gente, creo que está en el camino correcto con el enfoque de clúster y tiempo.
El año pasado preparé una demostración para Esri UC mientras trabajaba con algunas personas en Snow Leopard Conservancy, disponible en: http://resources.arcgis.com/gallery/file/geoprocessing/details?entryID=1F9F376F-1422-2418 -7FBC-C359E9644702
Analiza los "sitios de alimentación" (grupos) de leopardos de las nieves según los criterios dados:
Si bien utiliza las herramientas de Esri para hacer el análisis de distancia, el script de Python en el interior podría ayudarlo con la idea de agrupamiento una vez que sepa qué puntos están cerca uno del otro. (utiliza la teoría de gráficos: http://en.wikipedia.org/wiki/Graph_theory )
Como se menciona en las otras respuestas, hay documentos disponibles para determinar los atributos que necesitaría para tomar las decisiones.
El análisis se basó libremente en los conceptos de: Knopff, KH, ARA Knopff, MB Warren y MS Boyce. 2009. Evaluación de las técnicas de telemetría del Sistema de Posicionamiento Global para estimar los parámetros de depredación del puma. Journal of Wildlife Management73: 586-597.
fuente
Para ejecutar cualquier tipo de agrupación en su conjunto de trayectorias, debe tener una forma de calcular la similitud o la distancia de los pares de trayectoria. Hay varios métodos existentes para esto, y se están desarrollando otros nuevos para casos especiales o para corregir una deficiencia de los tradicionales (estoy trabajando personalmente en uno nuevo para mi tesis doctoral). Los algoritmos bien conocidos son los siguientes:
Si está en este campo, le recomiendo el libro llamado "Computación con trayectorias espaciales" de varios investigadores de Microsoft Asia.
fuente
Esto también puede ser de ayuda para usted:
Orellana D, Wachowicz M. Explorando patrones de suspensión de movimiento en movilidad peatonal. Geogr Anal. 2011; 43 (3): 241-60. PubMed PMID: 22073410.
También eche un vistazo a este blog:
ideasonmovement.wordpress.com/
fuente