城市交通路况的短期预测是支持交通管理、在线导航的基础应用。出租车轨迹作为低成本、高时空覆盖率的交通监测数据类型,已广泛用于提取实时路况,支持路况短期预测。
然而出租车轨迹时空覆盖极不均衡,导致大量的路段和时段轨迹数据缺失或覆盖率不足,难以直接基于轨迹数据精确估计全路网所有路段全天候的交通状态,精度和可靠性都不能满足实时交通路况估计和短期预测的需要。
因而基于不均衡轨迹数据的全路网交通路况在线短期预测成为大城市交通精细化监测和管理的一大技术难题。
根据轨迹数据的时空分布模式将路网所有的路段分成若干层(一般为2-3层)。主干路网承担大部分的交通流量,是整个城市交通的基本骨架。
提出轨迹驱动的多层时空图神经网络路况预测方法(T-MGNN),依托不同路网的层级建立多层时空图神经网络,设计顾及轨迹时空分布的层内和层间消息传递机制。
通过层间消息传递机制将主干路网提取的路况时空信息传递至轨迹稀疏的次级路网,实现交通路况信息的在线补全和快速预测。
本文采用基于流量统计的方法进行分层,取特定时段的轨迹数据(如工作日早高峰),统计每个路段预设时间粒度(如5 min)的平均流量,并绘制流量的概率分布函数,设置预设阈值,通过流量数据分布进行路网分层。
一般可取流量在前20%的路段作为主干路网。设路段流量范围是(0,qmax),P(q)代表路段流量的概率密度函数。
分层后,主干路网多数路段在大部分时段都能直接从轨迹中提取较完整可靠的路况信息,次等级路网存在大量轨迹数据稀疏的路段。
T-MGNN模型在不同层的路网上同时调用多次路况时空关联表征模块。每个路况时空关联表征模块主要包括因果膨胀卷积层和图注意力层。
因果膨胀卷积在因果卷积的基础上设定膨胀因子,不增加参数数量同时扩大卷积的感受野,从而提升对时序特征的表征能力。
受到图注意力网络的启发,在空间维度上,实现了图注意力层为每个邻居路段分配不同权重,体现出路况在空间上的异质性,有效提取空间关联。
层间特征转换层通过层间转换矩阵和层间有向注意力消息传递机制,将主干路网提取的可靠路况时空信息逐级传递至轨迹稀疏的次级路网,并与时空关联模块提取的次级路网路况时空特征融合。
实验所需要的数据包括路网和轨迹数据2类。实验选择轨迹数据较为丰富的武汉市三环线以内及沌口、吴家山、光谷东3个片区的路网。
路网由Open Street Map开放平台获取,并利用QGIS软件进行简化。简化后路网含路段边5,659条,交叉点4,419个。
选取2018年7月2日-7月8日一周内连续运行的出租车轨迹数据进行实验,单日轨迹包含车辆约1.243万辆,采样平均间隔为10 s,采样频率不低于0.2 Hz。
轨迹数据中存在较多异常数据,如速度小于0或者大于120、在一定时间内距离不发生变化、长期停车等情况,在进行速度估计之前需要对异常数据进行清洗。
路段速度估计流程包括单车速度估计、多车速度加权、速度时间平滑3部分。首先根据出租车在当前路段以及前后路段交汇处的轨迹点估计单辆车的速度,其次根据GPS轨迹数据质量对多辆车的速度进行加权计算得到路段速度,最后根据路段轨迹点数量的对速度进行时间平滑。
选择工作日7-9时以及17-19时高峰期数据,统计各路段5 min窗口的平均流量。流量大于6的路段设置为主干路网,共1,598条,占全部路网的28%,其余路段设置为次级路网,共4,061条,占全部路网的72%。
模型 | 单步预测5分钟 MAE/(km/h) | 单步预测5分钟 RMSE/(km/h) | 单步预测5分钟 MAPE/% | 状态一致率/% |
---|---|---|---|---|
ST-KNN | 2.80 | 4.21 | 9.51 | 78.28 |
BTMF | 3.26 | 4.97 | 10.24 | 81.62 |
SGMN | 2.18 | 3.13 | 6.04 | 85.52 |
T-MGNN | 2.01 | 2.91 | 5.45 | 86.18 |
深度学习方法优于浅层机器模型方法,在路况预测中具有更强的学习有效特征的能力。基于图的深度学习模型中,使用动态图的模型预测精度显著高于SGMN、T-GCN。T-MGNN采用了动态路网分层方法和路网分层关联表征模型,更好地捕捉到大规模路网层次结构,预测性能上表现最佳。
由于大规模城市路网轨迹分布存在不均衡性,次级路网比主干路网轨迹稀疏,路况变化频繁更为复杂,所有模型在次级路网上计算的指标均下降。得益于分层结构中的层间消息传递机制,T-MGNN将主干路网中提取的路况关联表征转换至次级路网加以利用,有效提升了轨迹分布稀疏路段的路况表征质量。
在武汉数据集上对T-MGNN模型进行消融实验表明,使用STCE模块可以提升所有精度指标,分层结构使模型整体预测性能提升,同时次级路网预测误差和主干路网预测误差差距减小,说明层间消息传递能充分发掘大规模路网中蕴含的层次结构。
模型 | 训练时间/epoch (s) | 推理时间/iter (ms) |
---|---|---|
SGMN | 33.55 | 6.32 |
DGCRN | 85.42 | 105.06 |
T-MGNN(分层) | 5.53 | 3.91 |
DGCRN训练和推理均最慢,可能的原因是使用了循环卷积模块。T-MGNN凭借其较小的参数量获得了微弱优势。同样的训练周期数,分层后的T-MGNN能更快收敛,且每个周期耗时更短,这显示了分层结构对模型整体信息传递的有效性。
交通路况随时间变化波动,对2018年7月2日9、14和20时这3个不同时段的单步预测结果进行评估。T-MGNN在3个时段所有指标均取得最好表现,证明具备分层结构的T-MGNN能提升稀疏轨迹路段的预测性能,在大规模路网上拥有更强的模拟复杂多变路况能力。
以9:00时段为例,对全路网的路况分析显示,对于城市主干路网的拥堵状态,各模型都具有良好的预测性能,但是在一些轨迹稀疏的城市边缘区域,如三环线外的沌口和光谷东,PDFormer和Causal-GCNM与真值均出现较多偏差,而T-MGNN依然能正确进行路况预测。
T-MGNN预测路况分布均匀,预测拥堵状况与真值接近,在两级路网均取得最佳表现,证明T-MGNN能将主干路网信息充分利用至次级路网,在更小的颗粒度上也能实现精确的拥堵路况预测。
基于大规模原始轨迹数据的动态路网分层方法。根据轨迹体现的交通模式在不同时段上对路网进行分层,分解为主干和若干级次要路网。
基于多层时空图神经网络的路网分层关联表征模型。依托分层路网,提出基于因果膨胀卷积和图注意力的多层时空图神经网络,设计层内和层间消息传递机制。
表征-预测一体化集成短期预测建模方法架构。在路况关联表征模型基础上,设计实现了表征-预测一体化的集成图神经网络预测模型。
探讨最少需要多少轨迹数据才能发挥模型的性能
在更多的城市应用和改进本方法
改善路网自适应分层的方法,更好地应对轨迹的时空分布不平衡
应用图Transformer框架并改进层间消息传递机制
本文方法对于提升城市交通路况的监测精度和效率,改进交通在线控制和组织,支持出行者信息服务等上层应用都有着一定的应用价值。
本文方法提供了完善实用化的技术流程,可以直接用于交通管理的实际应用。在潜在的缺点方面,方法在应对轨迹极度稀缺时可能无法构建较为完整的主干路网。此时,不同层级路网的消息传递的效果也会有所下降。
* 以上内容由AI自动生成,内容仅供参考。对于因使用本网站以上内容产生的相关后果,本网站不承担任何商业和法律责任。