研究摘要

识别高速公路规律出行群体是精准引导出行需求、提供个性化出行服务的前提与基础。既有研究主要面向城市交通、基于时间-频率指标提取出行特征来识别规律出行群体,而针对高速公路出行用户的周期性规律特征分析未能得到充分探索,导致部分周期性出行用户识别的缺失。本文基于广西壮族自治区高速公路联网收费数据,以用户进出收费站轨迹作为信号输入,通过傅立叶变换计算前3幅值对应周期的方差作特指标研判该用户是否为高速公路规律出行群体。

研究提出了基于傅立叶变换的"轨迹绘制-频谱变换-周期分析"高速公路周期性用户识别与分析方法,以广西壮族自治区为案例研究,结果发现:

  • 广西壮族自治区高速公路出行记录具有一定的头部效应,20%的车辆提供了55%~60%的通行记录;
  • 在0.5的周期方差阈值下约有12%的客、货车辆为规律用户;在1.0和1.5的周期方差阈值下,约18%的客、货车辆为规律用户;在2.0的周期方差阈值下,约25%的客、货车辆为规律用户;
  • 高频的出行客车不一定具有更强的周期性规律;而周期性规律强的客、货车通常具有更短的出行距离,且在出行时刻上亦更具稳定性。

本文的研究对于拓展公路规律用户识别方法、探索公路用户出行周期性特征具有一定的参考意义。

研究背景

高速公路智慧化需求日渐高涨

近年来,随着高速公路基础设施日趋完善,高速公路出行量逐年攀升,高速公路智慧化需求日渐高涨,用户期待更加安全、快速、通畅以及个性化的交通出行服务。高速公路出行需求特征分析既是交通需求管控的基础,也是提高高速公路出行服务个性化的前提。

通过深入了解用户出行特征,识别规律性高速公路出行用户,可以帮助规划者更好地优化道路网络和交通流量,制定更有效的交通管理策略,减少拥堵和提高通勤效率。

出行的规律性与周期性

出行的规律性是指出行群体在多次出行过程中形成的特征以一定的频率重复出现的性质。周期性作为出行规律性的一种特殊情况,表现为出行特征在固定时间间隔内的循环,其出行行为模式呈现周期性一般在时间上与周而复始的生活规律如工作日上下班、周末出游或者休息相一致。

高速公路出行规律性研究无法直接沿用城市交通出行的既有经验,其特殊性主要在于高速公路主要承担长程、跨区出行,其分析周期与城市交通不完全一致。

研究现状与不足

针对高速公路规律出行用户的识别与分析,目前主要依托海量电子不停车收费(Electronic Toll Collection, ETC)数据开展相关研究。现有研究主要采用基于起讫点的出行频率和时间的阈值或聚类来探索出行的重复性规律,忽略了出行的周期性规律,导致部分周期性出行用户识别存在缺失。

傅里叶变换(Fourier Transform)作为一种经典的将时域上的信号转换到频域上的数学工具,有利对信号的频率特征进行分析和处理,以达到分析信号周期的目的。因此,本文以高速公路联网收费数据为基础,通过绘制高速公路用户进出收费站出行轨迹,采用傅立叶变换识别客、货运用户的出行周期,通过周期的稳定性判别识别周期性规律出行用户。

研究方法

高速公路周期性规律用户识别与分析框架
高速公路周期性规律用户识别与分析框架

高速公路联网收费数据处理

通过对原始字段的拆分,分析每条记录的进、出站车辆ID、时刻以及行程车速,针对以上信息进行质量检验,删除进出站车辆ID不匹配、进出站时间不在统计范围内以及行程速度大于200 km/h的记录,为后续研究提供有效的数据集合。

出行信息提取

从有效的数据集合中,以车辆ID为关键字段提取不同的出行用户记录,计算用户出行的次数等指标,并通过时空匹配用户起讫点及其访问次数、访问时段指标,为后续用户出行特征分析提供基础。

出行轨迹绘制

针对不同的出行用户对其进行拆分,并依据时间进行排序,以构成连续的进、出站记录。制定高速公路出行轨迹绘制原则,完成高速公路出行轨迹绘制并分析轨迹的基本特征。

规律用户分析

基于轨迹特征分析结果,采用傅立叶变换提取轨迹周期,并计算轨迹特征指标进行周期分析和出行特征分析,识别周期性规律出行群体。

傅立叶变换的数学原理

傅立叶变换是常见的频域分析方法,基本假设是任何一种无趋势的时间序列都可以分解成若干不同频率的周期波动,借助傅立叶变换从频率的角度揭示时间序列的规律。其基本过程是将时域上的信号变换到频域上,用很多个周期函数来合成时域信号,并找信号幅度最大的那个正弦波的频率,作为函数的周期。

对于指定的高速公路用户,用xn表示其第n次被观测到时所在的收费站序号,按照时间排序则构成一组离散的高速公路用户所在收费站的时序信号{xN}=x1,x2,x3,…xN-1...

实验区概况与数据来源

广西壮族自治区概况

  • 面积:23.76万km2
  • 常住人口:5,027万人(2023年底)
  • 民用汽车保有量:942.95万辆
  • 千人汽车拥有:188辆
  • 公路总里程:18.36万km(高速公路9,067km)
  • 公路客运量占总客运量:60%以上
  • 公路货运量占总货运量:75%以上
  • 公路运输是自治区的主要运输方式

研究数据

研究基于2023年5月29日—6月30日自治区高速公路联网收费数据开展。联网收费数据的具体字段包含车辆ID、驶入和驶出收费站名称与时间、车型、行驶里程和费用等信息。

数据规模

  • 全自治区462个收费站共计1,380万条原始记录
  • 抽取其中数据质量较高的556.17万条记录作为研究数据
  • 剔除端午假期前一日及假期期间(2023年6月21日—6月24日)进、出站收费站的记录
  • 最终494.63万条记录作为研究数据基础
广西壮族自治区2023年5月29日—6月30日高速公路进、出站交通量
广西壮族自治区2023年5月29日—6月30日高速公路进、出站交通量
广西壮族自治区高速公路收费站空间位置
广西壮族自治区高速公路收费站空间位置

实验结果与分析

高速公路进、出站轨迹提取与分析

以个体车辆为研究对象,提取其在不同收费站的进、出站轨迹信息。主要流程包括:车辆ID提取、车辆记录匹配、进出站信息拆分、进/出站记录排序以及车辆轨迹绘制。

数据统计

  • 提取152.73万个唯一客车车辆ID,匹配378.8万条出行记录,每辆客车平均提供2.48条记录
  • 提取32.73万个唯一货车车辆ID,匹配113.68万条出行记录,每辆货车平均提供3.47条记录
  • 统计发现,20%的车辆提供了55%~60%的通行记录
车辆ID占比与累计出行记录占比
车辆ID占比与累计出行记录占比

车辆轨迹绘制原则

以收费站为纵坐标,时间为横坐标,若车辆i的某一条记录在t1时刻从A收费站上高速,在t2时刻从B收费站出高速,则在点(t1,A)和(t2,B)之间绘制直线;若下一条通行记录车辆i在t3时刻从B收费站上高速,在t4时刻从C收费站出高速,则同样在点(t3,C)和(t4,D)之间绘制直线。

车辆轨迹绘制示意
车辆轨迹绘制示意

典型轨迹案例1:通勤出行

该用户主要在广西新吴圩收费站到广西苏圩收费站区间采用高速公路出行。通常在上午9:00左右从广西新吴圩收费站到广西苏圩收费站,而后在苏圩收费站附近停留至下午18:00左右重新进入苏圩收费站返回新吴圩收费站。

特征:居住地在新吴圩收费站附近、就业地为苏圩收费站附近的高速公路通勤出行用户。

典型轨迹案例2:城际短途运输

该用户主要在广西那坡收费站到云南富宁收费站区间采用高速公路出行,且主要是富宁至那坡方向采用高速公路出行。通常在上午由富宁收费站进入高速公路,往返于富宁与那坡收费站。

特征:可能为城际短途定点客、货运,如快速配送等,长期多次往返于相同地点。

高速公路车辆进、出站典型轨迹
高速公路车辆进、出站典型轨迹

高速公路规律用户及其出行特征

将高速公路用户的出行轨迹信号进行傅立叶变换,通过分析频谱特征识别周期性规律用户。

高速公路车辆轨迹及其傅立叶变换
高速公路车辆轨迹及其傅立叶变换

周期性规律用户识别

考虑到分析结果的可靠性,取2023年5月29日—2023年6月30日(不含端午假期)出行次数超过10次的用户作为分析对象,采用高速公路用户进出收费站轨迹傅立叶变换频谱幅值前三对应周期的方差作为特征指标研判该轨迹是否具有周期性规律。

  • 月出行次数不低于10次的客车有41,584个唯一车辆ID
  • 月出行次数不低于10次的货车有22,212个唯一车辆ID
周期方差与累积用户占比
周期方差与累积用户占比

周期性规律用户占比

周期方差阈值0.5: 约12%

周期方差阈值1.0和1.5: 约18%

周期方差阈值2.0: 约25%

不同周期方差下出行特征

周期方差 客车出行次数 货车出行次数 客车出行距离 货车出行距离
≤0.5 16.74次 21.22次 41.00km 63.92km
0.5~1.0 18.12次 21.44次 47.35km 64.38km
1.5~2.0 14.38次 16.91次 52.39km 74.68km
>2.0 14.85次 17.41次 62.53km 84.34km
客、货车最常进出收费站的时刻
客、货车最常进出收费站的时刻

不同高速公路用户出行特征对比

高速公路出行用户 客车周期性规律强 客车周期性规律弱 货车周期性规律强 货车周期性规律弱
出行次数 高(部分高频出行的周期性规律相对弱)
出行距离
出行时间 早晚高峰明显,相对稳定 早晚高峰明显,波动明显 高峰不突出,相对稳定 高峰不突出,波动明显

讨论

高速公路出行的"头部效应"

统计高速公路进、出站轨迹信息发现,20%的高速公路出行用户提供了55%~60%的通行记录,其他80%的用户仅提供5%~40%的通行记录,与其他地区ETC数据表现的特征基本一致,这种"头部效应"产生的主要原因在于,大部分的高速公路出行用户在单位时间内(如一个月)的出行次数较少。

然而,对比城市快速路的研究结果,2.8%的通勤车辆在早、晚高峰时提供了高达36%的交通量,可知城市快速路的这种"头部效应"要明显强于高速公路,尤其是在早、晚高峰期间。上述差异产生的原因主要在于早、晚高峰期间通勤交通的占比较高,如北京市早高峰期间通勤交通占比交通量超过80%。

周期性规律与出行特征的关系

尽管上述20%高频出行的高速公路用户提供了主要的通行记录,但是本研究分析发现,以周期方差为1.5划分周期性规律的强和弱,周期性规律强的客、货车整体而言具有更高的出行次数和更短的出行距离,其中频繁出行的客车不一定具有更强的周期性规律,即高频出行的客车在自身的出行周期内可能存在多个出行起讫点收费站。

可能原因: 一方面可能由于这部分高频出行用户的出行起点或终点范围内有多个可选择的收费站可供进、出高速公路,导致其周期性规律不明显;另一方面,考虑到出行成本方面的原因,这部分高频出行用户的一次出行,不需要全程常采用高速公路行驶,途中某段路驶出了高速公路。

针对更高的出行次数和更短的出行距离的出行用户作为高速公路出行需求管理和引导的重点对象,可考虑给予综合的费率优惠等方式,提升客户自我价值以保证一定的出行频率;对于高频出行但周期性规律相对弱的用户,考虑到该部分用户出行可能存在多种起讫点和路径的情况,可针对特定区域、线路或收费站给与费率优惠,引导回归高速公路行驶。

结论

传统以出行频率为关键指标的高速公路出行用户识别方法,结合出行时间特征能够区分出不同类型的出行用户,如通勤和非通勤等。此类方法仅反映了高速公路用户出行在特定起讫点上的出行频率和时间规律,难以反应其出行是否具有周期性规律,即高速公路用户是否按照一定的周期到访相同的位置。

本文基于高速公路联网收费数据,通过数据处理、信息提取、轨迹绘制,采用傅立叶变换分析用户出行周期特征,提出了基于傅立叶变换的"轨迹绘制-频谱变换-周期分析"的高速公路周期性用户识别与分析方法,为高速公路出行服务的智能化发展提供技术支持,促进出行服务的便捷化、高效化和个性化。

主要研究结论

  1. 广西壮族自治区高速公路出行记录具有一定的头部效应

    20%的车辆提供了55%~60%的通行记录。

  2. 周期性规律用户占比随周期方差阈值变化

    在0.5的周期方差阈值下约有12%的客、货车辆为周期性规律用户;在1.0和1.5的周期方差阈值下,约为18%的客、货车辆为周期性规律用户;在2.0的周期方差阈值下,约为25%的客、货车辆为周期性规律用户。

  3. 周期性规律与出行特征关系

    高频的出行客车不一定具有更强的周期性规律;而周期性规律强的客、货车通常具有更短的出行距离,且在出行时刻上亦更具稳定性。

本文所提方法能够用于分析高速公路进出站轨迹的周期性规律,识别高速公路周期性规律出行用户,为细化高速公路出行需求辨识、提供精准的高速公路出行服务奠定基础。但仍然存在数据层面和内容层面的不足之处,后续研究可以用户为单位对数据进行处理,剔除信息异常记录占比较多的高速公路出行用户,以保障用户出行记录的完整性;结合既有研究的方法和成果,实现高速公路用户的重复性规律和周期性规律的联合分析,为高速公路出行需求管理和差异化收费方案的制定提供更加全面、细致的理论依据。