所有类型的换乘行为的早高峰均早于公交和地铁的出行早高峰,短-长换乘的早高峰时间甚至比一般出行的早高峰时间提前了30分钟。
九种换乘行为的通勤距离峰值远大于一般出行的峰值,甚至多分布于20~40km之间,凸显了换乘群体的通勤成本负担之重。
本文方法漏检率低于3.81%,相比传统方法的34%漏检率,精确性显著提高,为城市交通研究提供了有效的模型算法支撑。
随着大城市规模不断扩大,城市人口越来越密集,其往往伴随着较严重的职住分离现象,即城市人群表现出工作聚集和居住聚集现象。在职住分离的情况下,混合交通换乘出行模式非常普遍,且对应的模式情形也较为复杂,但其背后蕴含的规律挖掘对深刻理解城市交通与规划布局具有重要意义。
由于各国公交系统刷卡数据的差异性,国内外学者从多种角度对换乘行为的提取开展了研究。当前公共交通换乘算法精度存疑,尤其针对缺失上车时间的IC卡数据集并不适用。针对上述难点,结合北京市公交-地铁IC卡刷卡数据,本文提出了一个新的换乘行为提取算法。
本文从海量公共交通IC卡数据的统计特征自动筛选换乘行为距离阈值和时间阈值,以实现时间-距离双约束条件下的换乘行为提取,并在此基础上对换乘行为模式进行分类研究,为深入探索城市换乘行为规律奠定良好的技术基础。
本研究以北京市为例,下辖16个区,总面积16410.54km²,是我国的政治中心、文化中心和科技创新中心。2021年末,北京市常住人口2188.6万人。
庞大的人口带来了巨大的交通出行量,2021年北京市全年客运量557707万人次,占全国总客运量的4.4%;其中,公共汽电车客运量229634万人次,轨道交通客运量306621万人次,两者相加占客运总量的96.2%。
本研究采用了北京市2015年4月1日—6月30日的公交和地铁的IC卡刷卡数据,平均每天有800万条公交乘车记录和1000万条地铁乘车记录。
序号 | 属性 | 数据类型 | 含义 |
---|---|---|---|
1 | GRANT_CARD_CODE | int | 一卡通卡号 |
2 | DEAL_TIME | int64 | 交易时间 |
3 | LINE_CODE | int | 线路编号 |
4 | ON_STATION | int | 上车站编号 |
5 | OFF_STATION | int | 下车站编号 |
序号 | 属性 | 数据类型 | 含义 |
---|---|---|---|
1 | GRANT_CARD_CODE | int | 一卡通卡号 |
2 | ENTRY_TIME | int64 | 进站时间 |
3 | DEAL_TIME | int64 | 交易时间 |
4 | ENTRY_LINE_NUM | int | 进站线路编号 |
5 | ENTRY_STATION_NUM | int | 进站站点编号 |
6 | EXIT_LINE_NUM | int | 出站线路编号 |
7 | EXIT_STATION_NUM | int | 出站站点编号 |
8 | END_OF_JOURNEY | int | 旅程是否结束 |
本研究提出了时间-距离双约束的换乘行为提取算法,其核心思想是根据公共交通刷卡数据的统计特征,自动筛选时间和距离阈值,进而实现换乘行为的精确提取。算法流程如图1所示。
换乘行为多发生在同站或临近站点。本研究构建了面向公交-公交换乘、公交-地铁换乘和地铁-公交换乘的识别模型。距离阈值选择过程主要包括:
通过上述方法,最终得到每种换乘方式的邻近站点距离阈值,结果如下表所示:
换乘种类 | 距离阈值(km) |
---|---|
公交-公交换乘 | 0.64 |
地铁-公交换乘 | 0.80 |
公交-地铁换乘 | 2.31 |
仅使用距离阈值识别换乘行为可能存在误差,需要结合间隔时间判断是否为连续的换乘出行行为。
通过计算换乘时间的频率分布图中前后两条频率柱的斜率变化率,将突变的极值点作为换乘行为的时间阈值。最终确定的时间阈值如下表所示:
换乘类型 | 时间差阈值范围 | 时间间隔(分钟) |
---|---|---|
短途 | (195,3713] | 1-22 |
中途 | (3713,9185] | 22-55 |
长途 | (9185,11921] | 55-72 |
本文采用换乘指数对换乘行为提取结果进行验证,计算得到的换乘指数为1.38,小于大城市不宜超过的1.5,说明了本文换乘提取算法的合理性。相比传统方法34%的漏检率,本文方法漏检率低于3.81%,精确性显著提高。
为了完整研究换乘人群出行特征,本文根据前半程和后半程的行程距离利用自然分割法将其划分为不同的模式。具体分类标准如下表所示:
后半程换乘类型 | 短距离(km) | 中距离(km) | 长距离(km) |
---|---|---|---|
短间隔 | (0,8.24] | (8.24,19.93] | (19.93,89.38] |
中间隔 | (0,8.05] | (8.05,21.11] | (21.11,89.01] |
长间隔 | (0,7.75] | (7.75,21.03] | (21.03,89.01] |
根据上述划分标准,将换乘模式划分为以下9种模式:
前半程长距离+后半程长间隔
前半程长距离+后半程中间隔
前半程长距离+后半程短间隔
前半程中距离+后半程长间隔
前半程中距离+后半程中间隔
前半程中距离+后半程短间隔
前半程短距离+后半程长间隔
前半程短距离+后半程中间隔
前半程短距离+后半程短间隔
所有类型的换乘行为的早高峰均早于公交和地铁的出行早高峰,短-长换乘的早高峰时间甚至比一般出行的早高峰时间提前了30分钟以上,说明该模式中的通勤上班人群需要付出更多的通勤成本。
长-短模式和长-中模式存在明显的早晚高峰,中午时段趋于平缓,而且其早高峰时间明显早于一般的公交和地铁的早高峰。而长-长模式并未呈现明显的峰值,可能由于其相当部分的通勤行为出于临时的通勤需求。
中-短模式和中-中模式与公交地铁基本一致,其早高峰开始时间略早于公交地铁早高峰。中-长模式在早上出现了2个小高峰,第一个小高峰均早于其他几种模式的早高峰,说明其通勤目的地更远。
公交和地铁出行距离的分布峰值差异很明显,公交出行距离峰值在1km左右,而地铁的出行距离在10km左右。
长-长、长-中、长-短换乘模式的出行距离的峰值较大,平均在27km左右,绝大部分第一段旅程是长行程的换乘行为整体的出行距离都在20km以上。
中-长、中-中、中-短换成模式的峰值平均在15km左右,中-长换乘在零附近有个小高峰,出现了异常的出行现象,可推测为部分人群快速完成了一个往返式的换乘行程。
短-长、短-中、短-短换成模式的峰值相对较低,但存在较大差异。短-中和短-长模式在零附近出现了一个峰值,说明了其中也存在往返式换乘的人群。
本文基于公共交通IC卡刷卡数据提出了时间-距离双约束下的换乘行为提取算法,并针对不同的换乘行为特征进行分类研究,分析其出行时间和出行距离的统计特征。本文所提出的算法能够根据数据统计特征,自动筛选时间阈值和距离阈值,进而实现换乘行为的精确提取。
本文所提出的方法可以根据不同城市内部站点分布的差异性自动选择距离阈值和时间阈值,以应用于不同的数据集。未来研究可以考虑采用更长时序的历史数据,并针对工作日、周末、节假日等日期进行分类研究,以呈现更加丰富的通勤特征。