技术路线

出租车OD流多尺度空间预测及其可解释性研究技术路线

图1 出租车OD流多尺度空间预测及其可解释性研究技术路线

数据准备与预处理

  • 出租车轨迹数据清洗
  • 地图匹配处理
  • 获取OD流数据

模型构建

  • 结合OD流和POI数据
  • 构建深度重力模型
  • 引入SHAP模型

多尺度模型解释

  • 不同模型比较分析
  • 全局和局部特征分析
  • 不确定性分析

深度重力模型

深度重力模型结构

图2 深度重力模型结构

深度重力模型(Deep Gravity)是对传统重力模型的拓展和改进,通过引入非线性层和隐藏层来增强模型的性能,能够更好地捕捉复杂的地理现象和移动行为。

模型公式:

[ \bar{y}(l_i,l_j) = O_i P_{ij} = O_i \frac{m_j^\beta f(r_{ij})}{\sum_k m_k^\beta f(r_{ik})} \]

  • 输入特征包括人口规模和8类POI地理空间特征
  • 使用前馈神经网络,包含多个隐藏层
  • 采用softmax函数将分数转换为概率

研究区概况与数据来源

研究区概况

本研究以北京市作为研究区,区域覆盖了景山、东华门、永定门外等331个街道,总面积达16140.54km²。

研究区北京市示意

图3 研究区北京市示意

数据来源

本研究使用了2个数据集:北京市兴趣点(POI)数据和出租车轨迹数据。

POI数据

收集自2020年的高德地图开放平台,选取了与人类流动密切相关的8大类POI,共703724条。

表1 北京市POI分类统计
POI类别 数量/万条
餐饮服务 9.83
购物服务 20.99
生活服务 13.26
公司企业 13.03
商务住宅 3.79
科教文化```html
体育休闲服务 2.88
交通设施服务 7.98

出租车数据

来自北京市各大出租车运营公司平台,选取2020年8月3日-6日早晚高峰时段(7:00-9:00和17:00-20:00)的数据。

早晚高峰时段居民出行订单数量随时间变化

图4 早晚高峰时段居民出行订单数量随时间变化

结果与分析

不同空间尺度下的OD流预测结果

基于重力模型、辐射模型和深度重力模型分别在不同的空间尺度上进行了OD流预测建模。

模型表现

  • 深度重力模型表现最佳,CPC值从0.47增加到0.83
  • 辐射模型次之,CPC值从0.21增加到0.49
  • 重力模型表现最差,CPC值从0.16上升至0.37

关键发现

  • 深度重力模型在1000~1500m范围内变化幅度最明显
  • 成功捕捉到北京市OD流网络的"散射状"特征
  • 晚高峰时段的人类活动比早高峰更为频繁
街道尺度下北京市出租车OD流预测结果

图7 街道尺度下北京市出租车OD流预测结果

模型全局重要特征分析

利用Shapley值法(SHAP)分析在早晚高峰时段各特征在不同空间尺度建模时对模型的贡献程度。

早高峰时段不同空间尺度下基于SHAP值的特征全局重要性

图9 早高峰时段不同空间尺度下基于SHAP值的特征全局重要性

晚高峰时段不同空间尺度下基于SHAP值的特征全局重要性

图10 晚高峰时段不同空间尺度下基于SHAP值的特征全局重要性

主要结论

1

无论是早高峰还是晚高峰,6种不同的空间尺度下,出行距离和公司企业类POI对模型的影响最为显著。

2

除公司企业类POI外,早晚高峰时段餐饮类POI对模型的影响较大。

3

在早晚高峰时段,购物类POI对模型影响也非常显著。

4

交通设施类POI对模型的影响一直呈负相关。

5

科教文化和体育休闲类POI对模型的影响最小。

模型局部重要特征分析

随机选取了北京市向阳街道至台湖镇的OD流预测值进行局部分析。

基于SHAP值的特征局部重要性

图11 基于SHAP值的特征局部重要性(向阳街道至台湖镇)

正向影响特征

  • 出行距离:对模型的正向影响最大,使预测值增加2.4
  • 公司企业类POI:使预测值增加2.11
  • 体育休闲类POI:使预测值增加1.86

负向影响特征

  • 餐饮类POI:对模型的负向影响最大
  • 科教文化类POI:使预测值降低1.74
  • 交通设施类POI:使预测值降低1.27

结论与讨论

主要结论

随着格网尺度的增加,模型的CPC值普遍呈上升趋势,而在街道尺度下,与重力模型和辐射模型相比,深度重力模型在OD流预测方面表现最佳,其CPC值高达0.83。尤其是在1000~1500m范围内,深度重力模型变化最显著。

在本研究所选各空间尺度下,对OD流预测精度影响最大的4个特征均为O、D点之间的出行距离,O、D点周围公司企业数量、餐饮服务数量以及购物服务数量。其中,出行距离对OD流预测精度影响最大,这一发现与传统重力模型的假设一致。

同一特征对OD流的局部影响不同于全局模型。例如,在全局模型下,科教文化和体育休闲类POI对模型的预测影响最小;而在向阳街道至台湖镇的局部重要特征分析下,却对模型预测产生较大的影响。

讨论

本研究提出了一种结合深度重力模型(Deep Gravity)与SHAP值(SHapley Additive exPlanations)的可解释人口流动预测模型,通过添加隐藏层捕捉各地理特征与OD流之间的非线性关系,可定量揭示不同空间尺度下各个特征对出租车轨迹OD流预测模型输出的影响。但本研究也存在一些不足:

  • 仅对工作日早晚高峰出租车OD流进行了预测与分析,未考虑周末或节假日的情况
  • 仅以出租车轨迹数据为例,未考虑其他形式的流动数据
  • 仅选取了兴趣点数据等建成环境因素,未考虑气候、经济和政策等其他潜在因素