随着城市治理体系与城市化建设的迅猛发展,以及城市交通数据的急速增长,众多交通安全问题、交通运输问题相继涌现。为了便于交通管理部门精准治理,以及帮助城市管理者提供有效决策,各类智能交通技术由此成为加快推进新型智慧城市的重要环节之一。
在全时空感知方面,依托于部署在城市的多种类型物联网设备、城市中的多源异构数据以及人工智能技术,可以对数据进行深层挖掘以及进行决策任务。然而,目前的机器学习及深度学习仍处于弱人工智能范围,其中数据特征的筛选更多依赖于人的干预。
为了提高智慧交通的水平,则需要让机器掌握大量的知识,并以类似人脑的方式进行决策分析。然而,知识图谱作为一种结构化的知识表示方法,能够将各类智能交通技术所涉及的关键信息、规则和关系进行整合和表达,为交通管理部门和城市管理者提供更全面、准确的知识支持和决策参考。
时空知识图谱是传统静态知识图谱的扩展,引入了时间和空间维度的信息,以更全面地描述实体、关系和事件之间的时空关联。它包含实体和关系在不同时间和空间下的变化情况,揭示事物的演化过程和时空模式。
动态知识图谱是一种特殊形式的知识图谱,专注于描述知识的变化和演化。它在静态知识图谱的基础上扩展为四元组表示,将时间信息纳入实体和关系的表达中。动态知识图谱可以包含结构和属性的变化,用于研究知识的时序演化和趋势变化。
为了捕捉空间图的交通路网结构信息并进行下游应用,需要构建由交通设备、固定兴趣点(Point of Interest, POI)及路网结构构成的静态地理空间图,即静态知识图谱。由于交通管理部门在日常管理工作中会收集大量文本形式的交通数据,各交通设备也会捕捉到海量的图像数据以及结构化的数值型数据,这些不同来源的数据构成了多模态的交通数据系统,利用其构建的具有多模态实体及多模态实体间语义关系的知识图谱即多模态知识图谱。在应用的过程中,由于知识具有时效性,所以交通事件需要在特定的时间基础上才更具研究价值。具有时序信息的知识图谱能够反映更多的信息,即动态知识图谱。
在地理空间信息领域,由于海量的地理空间数据具有多样性和异构性,故将地理数据与知识图谱技术结合应用的研究不断涌现。常见的操作是从开放的地理数据与知识中提取不同类型的地理知识实体,并以资源描述框架(RDF)的格式存储为地理知识图谱。
领域知识图谱在构建过程中由于涉及的领域范围不同,导致本体的构建有所差异。在地理空间知识图谱构建过程中,知识建模内部需要构建概念层,而概念层为各类本体(Ontology)的集合。地理空间数据本体是指一种用于描述相关知识的实体,并形式化地对共享概念体系进行说明的结构化数据模型。
区别于静态知识图谱,多模态知识图谱所利用的数据源包括文本数据、图像数据、视频数据以及音频数据。结合多模态数据进行研究能够全面理解特定主题或领域,并精确地表述复杂概念和关系。从无结构的文本数据中提取结构化知识是构建知识图谱的前提,因此有效提取和分析多模态知识是研究的重点内容。
交通管理部门在日常管理工作中收集了大量的文本交通事故数据,如何针对这些文本数据进行挖掘和分析,对于开展道路安全分析和对道路风险的防控研究有着重要的意义。
图1 多源知识的接入过程
图2 文本模态交通数据的知识抽取
为了获取更加全面的知识,丰富知识图谱的特征,近年来许多研究逐渐将时间信息引入知识表示学习和知识图谱补全中,即动态知识图谱。动态知识图谱的表示是在静态知识图谱的三元组基础上扩展为具有四元组表示的知识图谱。从结构上划分,动态知识图谱一般可分为结构动态及属性动态。
图3 xERTE框架体系架构
图4 地铁交通知识图谱实例
类型 | 优势 | 不足 |
---|---|---|
静态知识图谱 | 描述精确,能够准确描述交通领域实体间的关系和属性,包括道路网络拓扑结构、交通规则等静态信息;适于长期存储和高效查询,支持路径规划、道路管理等应用 | 缺乏实时性,无法实时反映交通状况的变化,对实时决策和调整有限;对于动态变化的需求有限,如交通流量预测、拥堵分析等 |
动态知识图谱 | 具有实时性,能够捕捉实时数据,对于实时决策和调整具有较强的支持能力;能够追踪和分析实体的历史演化过程,对于预测、推荐系统以及时间序列分析等应用具有价值 | 图谱构建和维护方面面临数据质量和准确性方面的挑战,需要处理噪声、数据缺失等问题;存储和计算成本较高 |
多模态知识图谱 | 信息全面,可以提供更加全面丰富的交通状况描述;综合分析多种模态数据,帮助进行交通态势分析 | 数据量较大,计算复杂度较高;需要解决数据融合和一致性的问题 |
如何从大规模的知识图谱中有效且高效地提取和利用有用信息,以支持下游任务,是一项艰巨的挑战。为了解决这个具有挑战性的任务,在机器学习领域,知识图谱表示学习引起了广泛的关注。知识图谱表示学习的目标是将知识图谱中的语义关系嵌入到一个低维空间中,同时要求保留原始知识图谱的语义和关系结构。
现有的知识图谱表示学习方法主要基于实体与关系间的结构性知识,很大程度上忽略了实体间的知识。并且一些表示方法虽然能够对实体知识进行有效的集成,但缺乏多模态知识的适用性。
图5 知识嵌入模型RMSE的流程
对于交通中的动态演化情况,传统知识图谱表示方法忽略了知识库中的时间信息。随着深度学习在各领域的逐步发展,其对时间序列数据进行有效编码的手段也越来越丰富。
图6 RE-NET的结构示意
交通领域是一个信息密集的领域,涉及到大量的结构化和非结构化数据。除了数值型的结构化数据,例如车辆速度、道路拥堵程度等,交通领域中还存在着大量的文本和图像数据。这些文本数据包括交通新闻、博客、社交媒体评论等,而图像数据则包括交通摄像头监控画面、交通标志和路况图片等。
知识推理技术通过挖掘和推断未知知识来完善知识图谱或纠正其中的错误知识,为下游应用提供支持。由于构建时会面临知识局限性以及数据的非静态特性,故通常会导致知识三元组的缺失。因此,知识推理对于预测知识图谱中缺失的关系具有重要的研究和应用价值。
在交通领域中,当处理非结构化文本数据、图像数据或结构化数据时,进行实体和关系抽取时经常会面临三元组缺失和不完整的问题。为了应对这些问题,知识图谱的补全技术应运而生。
图7 知识图谱补全技术实例
在交通领域,因果推理可以被应用于分析交通系统中不同变量之间的关系,例如交通拥堵与路网规划、交通安全与交通信号系统、驾驶员行为与交通事故等。
随着社会经济的不断发展,人口数量及汽车数量飞速增长。城市交通拥堵现象在此背景下接踵而至,城市交通和安全问题迎来了挑战。基于交通拥堵预测的各种手段可以为交通管理部门进行调度并做出决策。
图8 基于知识图谱的交通流量及拥堵预测
在交通系统中,预测轨迹目的地如何利用大规模轨迹数据是交通领域研究的一个重要分支。为了使机动车能够在复杂的交通场景中安全高效地行驶,需要对其运动状态进行预测。此外,由于驾驶员的行为是多模态的,这为预测任务带来一定的困难。
随着城市轨道交通网的复杂化,繁荣的交通不仅为社会带来了积极的效益,同时也带来了负面的影响。为了稳控道路交通安全形势并开展安全分析,挖掘事故的潜在规律成为亟须解决的问题。
当前在自动驾驶(AD)领域,研究学者们正在研究如何利用知识图谱来管理车辆传感器产生的海量异构数据。场景理解是自动驾驶领域中的一个重要部分,其需要考虑场景的各个方面,包括被检测的对象、事件、时间和位置。
交通交互服务对于自动驾驶汽车和驾驶者来说至关重要,例如路线规划和拥堵预警。通常利用强大的计算能力对无人机及车联网(IoV)中的路边单元(RSUs)等多源设备产生的数据进行实时处理。
交通领域知识图谱具备从多源异构数据中提取知识并进行高效管理,并为辅助决策提供服务的能力,这为现代交通行业提供了强大的基础。然而,在实际应用中,交通领域知识图谱仍然面临一些障碍和挑战,需要进一步的研究和解决:
在交通领域,多模态数据主要以文本和结构化数据为主,而图像视频类数据的应用较少,从而导致交通数据中的知识密度较低且难以提取。因此,在构建知识图谱时缺乏足够的支撑知识。
当前,知识图谱推理的研究如火如荼,在交通领域中,基于翻译模型和随机游走的方法简单高效、计算复杂度低,因此在知识图谱嵌入方面的研究相对较多。然而,这种方法仍然存在一些不足之处。
为使基于知识图谱的辅助决策更加有效,需要在本体构建方面不仅限于交通设施和交通参与者,还需结合城市物联网的其他设备构建本体,充分利用本体之间的密切关联关系。
交通数据的实时性要求极高,如何实现知识图谱的实时更新和动态演化是一个重要挑战。需要研究更高效的增量式更新算法和分布式处理框架。
本综述对交通领域知识图谱的关键技术及应用场景进行了全面概述。首先,本文简要概述了交通知识图谱的背景、概念以及构建方法。其次,介绍了多模态知识图谱及动态知识图谱的两大关键技术:知识图谱表示学习方法及知识图谱的推理方法。最后,对智能交通中几种应用场景下的决策应用进行了详细阐述,同时分析了现有知识图谱表示学习和推理等技术所面临的困难和障碍。此外,文章还提出了未来的研究方向,并展望了相关领域的发展,为后续的研究提供了有价值的参考。
* 以上内容由AI自动生成,内容仅供参考。对于因使用本网站以上内容产生的相关后果,本网站不承担任何商业和法律责任。