摘要

【目的】随着知识图谱技术在GIS领域应用和发展,地理知识图谱(GeoKG)近年来逐渐成为GIS领域的重要研究方向。GeoKG往往无法确保涵盖所有知识,知识的缺失和不一致性严重影响应用性能,需要采用GeoKG推理技术来自动补全缺失知识、识别矛盾知识、预测地理现象未来发展趋势。区别于通用知识图谱推理技术,GeoKG推理技术需要着重考虑地理知识的复杂时空特性。本文对近年来GeoKG的推理工作进行了全面介绍和总结。

【分析】首先,介绍了GeoKG推理的相关概念与问题描述;其次,本文分析了GeoKG推理的二大核心任务: ① 面向知识补全的推理模型,主要用于填补图谱中的空白,确保知识的完整性; ② 面向预测任务的推理模型,旨在通过已有地理数据预测未来的趋势。两类模型各自针对不同的应用场景进行优化,并在地理数据的处理中各有侧重。

【展望】展望了GeoKG推理的未来发展趋势,指出未来GeoKG推理技术的发展将更加关注时空数据的复杂关系处理、多尺度地理知识的推理、多模态数据的融合,以及提高推理模型的可解释性与智能化。此外,GeoKG与大规模预训练模型的结合也将成为关键方向。

关键词:地理知识图谱;地理知识推理;研究进展;地理知识表达;时空数据推理

1 引言

知识推理是指在已有的知识基础上,推导出新的知识或验证现有知识的一种智能化活动过程;它是人类智能活动的重要组成部分,一直以来也是人工智能的核心研究内容之一。在知识图谱出现之前,知识推理方法主要包括逻辑推理、规则推理、概率推理等形式化方法。自从2012年谷歌率先提出知识图谱概念以来,业界构建了大量开放的大型知识图谱工程(包括YAGO, DBpedia, Probase, NELL, Zhishi.me等),成为当前人工智能应用的主要知识载体和重要知识基础设施。

知识图谱通过结构化的三元组形式(实体-关系-实体)来表达客观世界中的概念、实体及其相互关系,形成了一种语义网络。知识图谱的结构化、语义关联和可扩展性特性使其成为知识推理的主要实现路径之一。知识图谱推理(KG Reasoning)通过将KG中的实体及其关系转化为低维向量空间,利用推理技术在知识库中推导出隐含的事实,补全缺失的三元组,从而提升知识图谱的完备性和应用效能,在知识搜索、智能问答、个性化推荐、预测决策等领域中取得了成功应用。

地理知识不同于一般知识,后者更注重时间、空间和变化的知识。因此,地理知识推理需要依赖于地理领域的知识图谱来进行处理和表达。

作为知识图谱与地理信息科学(Geographic Information Science, GIS)结合的产物,地理知识图谱(Geographical Knowledge Graph 或 Geospatial Knowledge Graph,以下简称GeoKG)近年来逐渐成为GIS领域的重要研究方向。GeoKG是一种以地理时空分布特征为核心的知识图谱,通过计算机形式化描述来表达地理概念、实体及其相互关系,进而支持地理时空分布相关知识检索与推理,是将传统地理信息服务拓展到地理知识服务的关键。

一方面,GeoKG通过结合GIS空间建模技术,扩展了通用知识图谱的内涵,建模了地理要素的时空演化特征和地理学"人地"互动规律特点。另一方面,GeoKG通过引入知识图谱的语义表达能力,实现了从聚焦地理空间实体几何形态表达到时空与语义一体化建模的GIS能力拓展。在这一框架下,GeoKG不仅继承了通用知识图谱的语义推理能力,还集成了地理空间信息处理能力,能够有效支持时空分析、地理信息查询等GIS任务。

具体来说,GeoKG推理主要通过引入空间和时间的维度,在传统知识图谱推理的基础上,扩展了空间拓扑关系和地理要素的时空动态演化模型,为GIS提供了可解释性的地理人工智能(Explainable Geographical Artificial Intelligence, X-GeoAI)的重要实现路径,有效辅助地理知识理解和发现。

国内外研究团队已经在GeoKG领域取得了一定的成果,并在此基础上初步探索了地理知识图谱的相关应用。国内的研究主要集中在GeoKG的构建及其与GIS时空数据的结合,并通过将空间拓扑关系和时间动态特征引入知识图谱推理技术,为地理现象的时空分析提供支持。同时多个国际研究团队也围绕空间语义建模、时空数据推理等方面展开了深入研究。例如,Google Earth Engine中的时空数据处理,以及美国国家地理空间情报局(NGA)在空间大数据推理方面的尝试,都是地理知识推理应用的具体体现。这些研究不仅为地理知识的自动化推理提供了坚实的技术基础,也为GeoKG的未来发展指明了方向。

尽管很多学者对通用知识图谱推理技术进行了总结和综述,目前仍缺乏GeoKG推理技术的梳理和总结。GeoKG的推理不仅需要考虑传统的语义关系,还需要结合空间和时间的维度,这使得GeoKG推理技术在方法论上与通用知识图谱推理存在显著差异。例如,地理要素的时空动态演化模型、空间拓扑关系等复杂性使得地理知识推理技术的要求更加复杂。国外的相关研究虽然已经初步尝试了将时空信息引入知识图谱推理,但这些方法大多尚处于理论探索阶段,缺乏对时空关系及地理学规律的深入结合。因此,针对GeoKG推理的系统性总结和技术梳理是非常必要的。

基于此,本文将在现有研究的基础上进一步拓展和总结GeoKG推理的最新算法以及应用进展,重点分析其在时空关系建模和推理方面的独特性与挑战。此外,本文也将结合作者团队此前的研究成果,对GeoKG推理技术在地理时空分析中的应用进行更为全面的探讨。在此过程中,我们将特别关注GeoKG推理技术与通用知识图谱推理的共通性和独特性,探索其在实际应用中的潜力和局限性。最后,本文还将讨论当前GeoKG推理面临的挑战以及未来可能的研究方向,为相关领域的研究人员提供参考。

2 地理知识图谱推理相关概念

2.1 地理知识图谱概念

地理知识图谱(GeoKG)是通用知识图谱技术与地理信息科学(Geographic Information Science, GIS)的结合产物,旨在通过知识图谱的形式化技术,将地理知识表示为计算机可解释、可复用、可推理的知识网络。地理知识不仅涵盖通用知识的语义特征,还具有明显的时空分布、多尺度和多模态特征。因此,GeoKG不仅遵循了通用知识图谱技术框架,还引入了地理实体的时间、空间和语义维度,支持地理要素的时空动态演化和多模态地理信息的关联表示。

三元组表示

通常GeoKG采用(头节点、关系、尾节点)的三元组方式表达地理知识,构建基础的语义关系网络。

五元组表示

由于GeoKG的时空性,也有研究认为GeoKG更遵循STKG(Spatial-temporal Knowledge Graph)框架中的实体五元组模型,采用(头节点、关系、尾节点、[时间域]、[空间域])表示。

GeoKG还支持多源异构时空大数据的多模态表达,包括文本数据、地图数据、兴趣点(Point of interest, POI)数据、交通网络数据、个体轨迹数据、街景数据、遥感影像数据等。

地理知识图谱表达语义轨迹示例

图1 地理知识图谱表达语义轨迹示例

以语义轨迹为例说明GeoKG地理知识表示。语义轨迹需要一体化表达个体的时空位置序列和出行活动语义(如:出行交通模式、出行速度、活动类别等),关联多模态的地理实体,如各类POI、道路和公交网络、天气状况、遥感影像、街景照片等。GeoKG以一种统一的方式表示地理知识定义(Schema)和地理知识实例(Instances)两个层次的知识。

GeoKG的时态特性

GeoKG往往具有时态信息,因此兼具时态知识图谱(Temporal Knowledge Graph, TKG)特点。从时态角度,地理知识可以分为:

瞬时知识

表示瞬发性的知识,存储了知识的时刻点(如GeoPoint对象)

区间知识

表示有一定持续性的知识,存储了知识的开始和结束时间(如SemSeg对象)

无时态知识

不具备时间信息(如地铁站POI),被视为可观察时间域内永久有效的知识

这些时态知识也往往伴随空间信息的变化,因此GeoKG不仅具备时态知识图谱的特点,还包含了对地理实体的空间位置的建模(如经纬度信息)。这使得时空知识图谱推理成为GeoKG推理中的一个重要组成部分。时空推理不仅要处理地理实体在时间维度上的动态变化,还要结合空间上的位置信息与拓扑结构来进行联合推理。在诸如交通流量预测、灾害预警等任务中,时空知识图谱推理展现出核心作用,能够通过捕捉时间和空间信息的相互作用,提升地理事件预测的准确性与及时性。

2.2 地理知识图谱推理任务

GeoKG知识推理(GeoKG Reasoning)是指利用GeoKG中实体、属性和关系的已知信息,通过一定的推理机制,发现隐含的地理知识或预测未来的地理现象。根据推理目标的不同,GeoKG推理任务可以分为两大类:面向知识补全的推理和面向预测任务的推理。

面向知识补全的推理

主要用于填补图谱中的空白,确保知识的完整性。例如,推断缺失的地理实体关系、补全地理实体的属性、识别矛盾的地理知识等。

应用场景:地理知识库构建、地理信息检索、地理问答系统等。

面向预测任务的推理

旨在通过已有地理数据预测未来的趋势。例如,预测交通流量变化、预测城市扩张方向、预测自然灾害风险等。

应用场景:城市规划、交通管理、灾害预警、环境监测等。

这两类推理任务虽然目标不同,但在方法上存在一定的共通性,都需要充分利用地理知识的时空特性,结合地理学规律,实现对地理知识的深度理解和挖掘。同时,它们也各自面临不同的挑战,需要针对性地开发推理算法和模型。

3 地理知识图谱推理技术

地理知识图谱推理技术是建立在通用知识图谱推理方法基础上的,但需要特别考虑地理知识的时空特性。根据推理任务的不同,地理知识图谱推理技术可以分为面向知识补全的推理技术和面向预测任务的推理技术两大类。

3.1 面向知识补全的推理技术

面向知识补全的推理技术主要解决GeoKG中知识不完整的问题,通过已知的地理知识推断出未知的地理知识,从而提高GeoKG的覆盖率和准确性。这类技术可以进一步细分为以下几种:

基于嵌入的推理

将地理实体和关系映射到低维向量空间,通过向量运算推断新知识

基于路径的推理

通过分析实体间的连接路径,推断实体间的潜在关系

基于规则的推理

利用预定义的地理规则或自动学习的规则进行推理

基于神经网络的推理

利用图神经网络等深度学习模型进行知识补全

时空知识图谱嵌入模型

Zhang et al., 2023

该研究提出了一种新的时空知识图谱嵌入模型,通过将时间和空间信息融入实体和关系的表示中,显著提高了地理知识补全的准确率。模型特别考虑了地理实体的空间邻近性和时间演化特性,能够有效捕捉地理知识的时空模式。

3.2 面向预测任务的推理技术

面向预测任务的推理技术主要解决地理现象的未来趋势预测问题,通过分析历史地理数据和当前状态,预测未来可能发生的地理变化。这类技术可以进一步细分为以下几种:

时序推理

基于地理实体的历史状态序列,预测其未来状态。

典型应用:交通流量预测、气象预报、土地利用变化预测等。

空间推理

基于地理实体的空间分布和拓扑关系,推断空间模式和趋势。

典型应用:城市扩张预测、疫情传播模拟、环境污染扩散预测等。

时空联合推理

综合考虑时间和空间维度,对地理现象进行整体预测。这种方法能够捕捉地理要素在时间和空间上的复杂交互关系,提供更全面的预测结果。

典型应用:城市热岛效应预测、自然灾害风险评估、人口迁移趋势预测等。

基于时空知识图谱的交通流量预测框架

Chen et al., 2024

该研究提出了一种基于时空知识图谱的交通流量预测框架,通过构建道路网络的时空知识图谱,融合多源交通数据,实现了对城市交通流量的高精度预测。该框架特别考虑了道路网络的拓扑结构和交通流的时间动态性,能够有效捕捉交通流量的时空依赖关系。

3.3 地理知识图谱推理的特殊挑战

与通用知识图谱推理相比,地理知识图谱推理面临一些特殊的挑战:

时空复杂性

地理知识具有明显的时空特性,需要同时处理时间和空间维度的信息,增加了推理的复杂性。

多尺度问题

地理现象往往存在于不同的空间和时间尺度上,推理模型需要能够处理多尺度的地理知识。

数据异构性

地理数据来源多样,包括遥感影像、矢量数据、文本描述等,需要处理异构数据的融合和推理。

不确定性

地理现象受多种因素影响,存在较大的不确定性,推理模型需要能够处理和量化这种不确定性。

针对这些挑战,研究人员提出了各种改进的推理方法,如融合空间拓扑关系的知识图谱嵌入模型、考虑时空尺度的多层次推理框架、基于不确定性量化的概率推理模型等。这些方法在不同程度上提高了地理知识图谱推理的准确性和适用性。

4 地理知识图谱推理的应用案例

地理知识图谱推理技术在多个领域展现出了广泛的应用前景,以下是一些典型的应用案例:

智慧城市

利用GeoKG推理技术,整合城市各类时空数据,实现城市交通流量预测、公共设施布局优化、城市热岛效应分析等应用。

案例:某大型城市基于GeoKG构建的智能交通管理系统,通过时空推理预测交通拥堵点,提前调整信号灯配时方案,有效缓解交通压力。

环境监测与保护

结合遥感数据和地理知识图谱,通过推理技术监测土地利用变化、预测生态系统演变、评估环境污染风险。

案例:某国家公园管理部门利用GeoKG推理技术,基于历史植被覆盖数据和气候变化模型,预测未来植被分布变化,为生态保护提供决策支持。

灾害预警与应急管理

基于GeoKG推理技术,整合地质、气象、水文等多源数据,预测自然灾害风险,辅助应急决策。

案例:某沿海地区防汛部门构建的台风灾害风险评估系统,通过时空知识推理,结合历史台风路径和当前气象条件,预测可能的受灾区域和程度,指导防灾减灾工作。

地理信息检索与问答

利用GeoKG推理技术,构建智能地理信息检索和问答系统,支持复杂的地理查询和推理。

案例:某旅游平台开发的地理智能问答系统,能够理解"找一家距离某景点步行15分钟内,且评分高于4.5星的餐厅"这类复杂查询,通过地理知识推理给出合理建议。

4.1 案例分析:基于GeoKG的城市交通流量预测

以城市交通流量预测为例,详细分析GeoKG推理技术的应用流程和效果。

应用流程

构建交通知识图谱

整合道路网络、交通设施、历史交通流量、天气条件、周边POI等多源数据,构建城市交通知识图谱。

时空特征提取

利用图神经网络等方法,从知识图谱中提取道路网络的拓扑结构特征和交通流量的时序特征。

多因素关联分析

分析交通流量与天气、时间、周边活动等因素的关联关系,识别影响交通的关键因素。

时空预测模型构建

基于时空图卷积网络等方法,构建交通流量预测模型,实现对未来交通状况的准确预测。

该案例表明,GeoKG推理技术通过融合多源地理数据,考虑时空关系和拓扑结构,能够有效提高交通流量预测的准确性,为智能交通管理提供有力支持。与传统方法相比,基于GeoKG的推理方法能够更好地捕捉交通系统的复杂依赖关系,提供更全面的决策支持。

5 未来展望

随着地理信息科学和人工智能技术的不断发展,地理知识图谱推理技术也将面临新的机遇和挑战。未来的研究方向主要包括以下几个方面:

时空数据的复杂关系处理

未来研究需要开发更先进的模型来处理地理数据中的复杂时空关系,特别是多尺度、多粒度的时空依赖关系。这包括开发能够同时处理点、线、面等不同几何类型的推理方法,以及处理不同时间粒度(如小时、日、月、年)的时序数据的推理技术。

多尺度时空关系建模

异构地理实体间关系推理

多尺度地理知识推理

地理现象往往存在于不同的空间尺度上,从微观到宏观,未来的研究需要关注如何在不同尺度上进行有效的知识推理,以及如何实现跨尺度的知识迁移。这包括开发能够自适应调整推理粒度的方法,以及研究不同尺度间知识的一致性和互补性。

跨尺度知识推理方法

尺度自适应推理框架

多模态数据融合

地理数据往往以多种形式存在,如文本、图像、矢量数据等。未来的研究需要关注如何有效融合这些多模态数据,实现更全面的地理知识推理。这包括开发能够处理文本描述、遥感影像、街景照片等多模态数据的推理方法,以及研究如何从不同模态中提取互补的地理知识。

多模态地理数据表示学习

跨模态地理知识对齐与融合

推理模型的可解释性与智能化

随着地理知识图谱推理技术在实际应用中的广泛使用,提高推理模型的可解释性和智能化水平变得越来越重要。未来的研究需要关注如何开发既具有高准确性又具有良好可解释性的推理模型,以及如何实现推理过程的自动化和智能化。

可解释的地理知识推理框架

自适应地理推理系统

与大规模预训练模型的结合

随着大规模预训练模型(如BERT、GPT等)在自然语言处理领域的成功,将这些模型与地理知识图谱推理技术结合,有望进一步提升地理知识理解和推理的能力。未来的研究需要关注如何利用这些预训练模型增强地理知识的表示和推理,以及如何将地理领域知识融入预训练模型中。

地理领域预训练模型

大模型与GeoKG的协同推理

总的来说,地理知识图谱推理技术正处于快速发展阶段,未来将更加注重时空特性的深入挖掘、多源数据的融合利用以及推理模型的智能化和可解释性提升。随着技术的不断进步,地理知识图谱推理将在智慧城市、环境监测、灾害预警等领域发挥越来越重要的作用,为地理信息科学的发展和地理问题的解决提供强有力的支持。

作者信息

段雨希

武汉大学测绘遥感信息工程国家重点实验室

博士生,主要从事地理知识图谱研究。

E-mail: yuxiduan@whu.edu.cn

陈碧宇

武汉大学测绘遥感信息工程国家重点实验室

通讯作者

教授,主要从事交通地理信息系统、时空大数据挖掘、城市空间信息学研究。

E-mail: chen.biyu@whu.edu.cn

基金项目:国家重点研发计划项目(2021YFB3900903);国家自然科学基金项目(42271473)

收稿日期:2024-08-19;修回日期:2024-11-01

* 以上内容由AI自动生成,内容仅供参考。对于因使用本网站以上内容产生的相关后果,本网站不承担任何商业和法律责任。