共享单车在资源共享、绿色低碳与大数据智能化管理等方面优势明显。在短距离出行和公交接驳中,居民愈发倾向选择共享单车。这将使私家车需求减少,慢行交通增加,地铁与公交出行相应增加。OD(Origin-Destination)量作为交通预测与规划的核心数据,表征了出行起点小区与终点小区之间(OD对)的出行量。自i小区出发,终到j小区的OD量可记为Xij,反之记为Xji。总体OD可用OD矩阵表示,它反映了两两小区之间的出行交换量。该数据的精准预测是本文的研究核心。
然而,当前的共享单车出行OD预测手段较单一,考虑因素片面,预测精度不高,难以为后续的设施规划与数量配给提供充分依据和有力支撑,一定程度上制约了该出行方式的发展。因此,利用大数据资源,融合城市计算与时空残差网络,构建共享单车出行OD预测模型以提高预测精度,尤为必要。
本研究针对传统OD预测方法,基于城市计算智能算法,提出改进的共享单车OD预测模型。传统的交通预测"四阶段"法包括出行生成、出行分布、交通方式划分与交通分配。其中出行分布的任务就是预测OD量,最具代表性的模型为重力模型。预测时,需要利用人工调查统计到的现状OD量,标定重力模型参数。再利用前一阶段预测出的交通小区发生与吸引量,利用标定后的重力模型逐一计算两两小区间的OD量。该过程中的人工工作量较大、调查为抽样调查、数据样本易偏且预测精度较低。
本研究提出融合城市计算与时空注意力残差网络模型(USTARN),是借助大数据与智能算法,自学习出行特征与规律,自训练因素影响机制,进而实现OD预测。图1为USTARN模型结构,主体包括数据处理模块、OD数据预测模型、城市因素预测模型及融合预测4部分,其中OD数据预测模型包括空间区域划分模块、时间序列分割模块、结合注意力机制的残差网络模块及组合预测模块。
图1 USTARN模型结构
数据处理模块将所有数据集清洗为有效数据,将共享单车订单数据集计为OD数据,为了避免学习过程中梯度爆炸并加快收敛及训练速度。将城市因素数据归一化处理。计算过程如式(1)所示。
xnew = (x - xmin) / (xmax - xmin)
式(1) 数据归一化公式
式中:x为原始气温数据;xnew则为归一化后的气温;xmin为气温数据中的最小值;xmax为气温数据中的最大值。
OD数据输入SAD模块中划分空间小区,在TSS模块中切割时间序列,生成Xh、Xd、Xw即邻近小时、日及周数据片段。将Xh、Xd、Xw输入EResNet模块中预测深度残差,然后通过Att模块强化预测流矩阵Yh、Yd、Yw,再输出OD预测结果Y1。将城市因素归一化数据嵌入全连接层,将其从低维映射到高维输出某一小时预测结果Y2。融合预测层将Y1和Y2输入全连接层并根据Y2调整Y1,输出未来某小时各区域共享单车OD量的批量预测最终结果Ypred。
深圳市共享单车运营商有哈啰单车、青桔单车及美团单车。全市注册用户2911万人,单车日均使用量达138万人次,车辆日均周转率3.5次,是我国共享单车系统较为完备的城市之一,具有典型的代表性及研究价值。本研究收集整理了深圳市政府数据开放平台公布的共享单车数据集,时间跨度自2020-01-30—2021-04-15,共计441d,其中包括364d无疫情数据和95d有疫情数据,总计38096760条订单数据。
表1 深圳市共享单车订单数据示例
车辆编号 | 起点时间 | 起点纬度/°N | 起点经度/°E | 讫点时间 | 讫点纬度/°N | 讫点经度/°E |
---|---|---|---|---|---|---|
8c3692da54d90dbf6dc22d | 2020-12-30 13:54 | 22.52306 | 114.04015 | 2020-12-30 14:30 | 22.51842 | 114.05858 |
b502ad04cf4dc7cdbd5ba4 | 2020-12-30 13:54 | 22.52298 | 114.04027 | 2020-12-30 14:30 | 22.51833 | 114.05792 |
通过对订单状态筛选、位置提取并匹配ArcGIS,可对共享单车起讫点位置进行可视化分析,图2为2021年4月13日共享单车订单起点分布情况。
图2 4月13日共享单车订单起点分布
通过对深圳市行政区进行小区划分,划分为16×16共256个网格单元,将订单GPS数据填充进各小区,可得到不同地理属性的共享单车小时分布。发现共享单车主要集中地为居民区及公共交通枢纽附近、商业及工业用地区域,且城市化高的市中心地区分布量远高于郊区,宝安区出行量最多,福田区出行密度最大,坪山区及大鹏新区出行量鲜少。其中大量市民由住宅区-轨道站点-写字楼之间的短途接驳需求旺盛,出行目的多为通勤。
通过连接订单数据与日历信息,可得到共享单车工作日与非工作日的小时出行量。引用seaborn库强化可视化分析,发现工作日单车出行量均呈现马鞍状分布,在8:00及18:0000达到顶点,且早高峰出行量大于晚高峰,工作日时间分布不均匀性明显,非工作日白天单车出行量分布均匀,如图4所示。
对数据进行时间特征处理,利用pandas计算数据的斯皮尔曼相关系数矩阵,如图3所示。
图3 城市因素影响分布
(1) 疫情。关联疫情与单车订单数据可分析二者间关系,如图8所示。疫情发生时日均出行量较无疫情时增加50%左右,这是由于政府缩减公共交通服务且疫情在共享单车系统中传播风险较小所致。每日新增人数达10人以上时,日均出行量缩减至5万辆左右,推测是由于疫情管控措施升级导致居民出行总量骤减。
(2) 气温。结合气温数据与订单数据分析发现,在当日最低气温低于10°C及大于25°C时出行量较小,处于10°C~25°C时出行量大于150万辆。
(3) 天气。结合天气数据与订单数据分析发现,天气状况对出行量有显著影响,晴朗、多云天气日均出行量大于120万辆,雾霾及小雨天气出行量有所下降,中雨及以上恶劣天气出行量极少。
(4) 风速。结合风速数据与订单数据分析发现,风级与日均出行量成反比,1级风时日均出行量最高,4级风时极少,5级风时无出行量。
综上可得,疫情、气温、天气及风速因素对共享单车出行均存在一定影响。月份和是否工作日的影响性体现在时空序列中。由于这些因素对共享单车出行存在的影响,本文谈及的城市因素包括疫情、气温、天气、风速。
为有效提高共享单车OD预测精度,提出了融合城市计算的时空序列切分残差网络模型,该模型融合了共享单车时空数据,实现了对共享单车OD的精准预测。以深圳市地区作为研究对象,研究得出以下结论:
由于数据集与研究条件限制,案例分析中未能选取更多城市因素数据集和分析用户个体出行偏好,未来工作中,可添加更多上述因素并添加相应功能模块,利用更好研究条件进一步预测更大范围的单车需求。尽管如此,本研究所取得的一般性规律与模型方法,仍可为同类研究所借鉴。
* 以上内容由AI自动生成,内容仅供参考。对于因使用本网站以上内容产生的相关后果,本网站不承担任何商业和法律责任。