图1 出租车OD流多尺度空间预测及其可解释性研究技术路线
图2 深度重力模型结构
深度重力模型(Deep Gravity)是对传统重力模型的拓展和改进,通过引入非线性层和隐藏层来增强模型的性能,能够更好地捕捉复杂的地理现象和移动行为。
模型公式:
[ \bar{y}(l_i,l_j) = O_i P_{ij} = O_i \frac{m_j^\beta f(r_{ij})}{\sum_k m_k^\beta f(r_{ik})} \]
本研究以北京市作为研究区,区域覆盖了景山、东华门、永定门外等331个街道,总面积达16140.54km²。
图3 研究区北京市示意
本研究使用了2个数据集:北京市兴趣点(POI)数据和出租车轨迹数据。
收集自2020年的高德地图开放平台,选取了与人类流动密切相关的8大类POI,共703724条。
POI类别 | 数量/万条 |
---|---|
餐饮服务 | 9.83 |
购物服务 | 20.99 |
生活服务 | 13.26 |
公司企业 | 13.03 |
商务住宅 | 3.79 |
科教文化```html | |
体育休闲服务 | 2.88 |
交通设施服务 | 7.98 |
来自北京市各大出租车运营公司平台,选取2020年8月3日-6日早晚高峰时段(7:00-9:00和17:00-20:00)的数据。
图4 早晚高峰时段居民出行订单数量随时间变化
基于重力模型、辐射模型和深度重力模型分别在不同的空间尺度上进行了OD流预测建模。
图7 街道尺度下北京市出租车OD流预测结果
利用Shapley值法(SHAP)分析在早晚高峰时段各特征在不同空间尺度建模时对模型的贡献程度。
图9 早高峰时段不同空间尺度下基于SHAP值的特征全局重要性
图10 晚高峰时段不同空间尺度下基于SHAP值的特征全局重要性
无论是早高峰还是晚高峰,6种不同的空间尺度下,出行距离和公司企业类POI对模型的影响最为显著。
除公司企业类POI外,早晚高峰时段餐饮类POI对模型的影响较大。
在早晚高峰时段,购物类POI对模型影响也非常显著。
交通设施类POI对模型的影响一直呈负相关。
科教文化和体育休闲类POI对模型的影响最小。
随机选取了北京市向阳街道至台湖镇的OD流预测值进行局部分析。
图11 基于SHAP值的特征局部重要性(向阳街道至台湖镇)
随着格网尺度的增加,模型的CPC值普遍呈上升趋势,而在街道尺度下,与重力模型和辐射模型相比,深度重力模型在OD流预测方面表现最佳,其CPC值高达0.83。尤其是在1000~1500m范围内,深度重力模型变化最显著。
在本研究所选各空间尺度下,对OD流预测精度影响最大的4个特征均为O、D点之间的出行距离,O、D点周围公司企业数量、餐饮服务数量以及购物服务数量。其中,出行距离对OD流预测精度影响最大,这一发现与传统重力模型的假设一致。
同一特征对OD流的局部影响不同于全局模型。例如,在全局模型下,科教文化和体育休闲类POI对模型的预测影响最小;而在向阳街道至台湖镇的局部重要特征分析下,却对模型预测产生较大的影响。
本研究提出了一种结合深度重力模型(Deep Gravity)与SHAP值(SHapley Additive exPlanations)的可解释人口流动预测模型,通过添加隐藏层捕捉各地理特征与OD流之间的非线性关系,可定量揭示不同空间尺度下各个特征对出租车轨迹OD流预测模型输出的影响。但本研究也存在一些不足: