新一代人工智能驱动下地图学研究的机遇与挑战

摘要

随着生成式人工智能(AIGC)为代表的新一代人工智能的快速发展,加速了各个学科转向人工智能驱动的科学研究,地理空间智能(GeoAI)技术在解决传统制图学任务注定会比传统的方法具有更好的性能,地图学也因此迎来了新的机遇与挑战,产生智能地图制图新领域,形成智能地图制图学。

地图学研究有人工智能传统,但是过去受限于人工智能工具的计算能力等原因,并未取得很大的进展。随着进入智能化时代,人与机器都将成为制图与读图的主体。 地图内容的产生经历了专家生成内容和用户生成内容的阶段,正在向人工智能生成内容阶段发展。人工智能与地图传输模型的结合衍生出智能地图传输模型,包括制图信息智能获取、智能制图、智能读图、地图信息智能解读4个环节,进而从这4个方面对智能地图的研究进展进行了分析和梳理。研究显示,使用智能化方法解决地图学问题的研究仍然处于起步阶段,人工智能与地图学结合仍存在诸多挑战,包括缺乏训练数据集、模型算法缺乏泛化能力和可解释性等,这些也是未来可以发展的方向。

生成式人工智能
智能地图制图学
地理空间智能
智能读图
智能制图

1 引言

地图既是地球空间信息的可视化形式和人类空间形象思维的表现,也是空间信息传输与认知的重要手段,随着时代的发展,地图学也面临着诸多的机遇与挑战。地图以科学的符号系统、地图投影和综合方法表达复杂地理世界的空间结构和空间关系,移动互联网络、传感网、物联网和智能移动终端的飞速发展使得信息内容更丰富、获取形式更多样,人与人、人与物、物与物之间按需进行信息获取、传递、存储、认知、决策等功能的地图新形式已经来临。

信息与通信技术的快速发展带动人类进入地理空间、人文社会空间和信息空间相融合的三元空间,地图制图的目的、人员、对象和环境等均发生巨大变化,地图的类型、空间对象、表达维度、地图角色等呈现出显著泛化特征,现有地图学理论无法引领和指导当代的地图实践。

生成式人工智能(AIGC)模型代表的新一轮人工智能技术浪潮正推动人类社会全面变革,受到了学术界、工业界和大众的广泛关注。以GPT-3和GPT-4等为代表的大型语言模型(LLM)、Stable Diffusion为代表的文本转图像模型的发展,加速了人工智能研发。各个学科的科学研究范式也正加速转换,越来越多的学者也转向人工智能驱动的科学研究(AI for science)。

"地图是永生的,作为人类的一种文化工具,地学的第二语言,决不会由于数字化、电子化反而无所作为。"
—— 陈述彭院士

通过机器学习,特别是深度学习,人工智能为计算机视觉、自然语言处理等一系列具有巨大挑战性的问题提供了很好的解决方案。对于地理学而言,地理空间领域的智能化发展和研究迎来了新的机遇和挑战。地理空间科学与人工智能相交叉形成了地理空间人工智能(GeoAI)的研究方向,目前已经在空间表征学习、时空预测和空间插值、对地资源环境监测、地图学、地理文本语义分析等方面开展应用。地图学与人工智能交叉融合,产生智能地图制图新领域,形成智能地图制图学。

2 人工智能在地图学中的发展

2.1 地图学研究的人工智能传统

人工智能是指在机器中模拟人类智能,其发展可以追溯到20世纪50年代,经历了多次发展与兴衰。2011年以后进入了深度学习和大数据发展时期,大多数的深度学习模型都是基于人工神经网络(ANN)发展起来的,例如卷积神经网络(CNN)、对抗神经网络(GAN)等。自2020以来又进入了AI时代和生成人工智能时期,transformer构架的大语言模型不断涌现。

人工智能技术应用在制图领域并非一个新话题,吴忠性就认为地图学的发展可分为三大阶段:第一个阶段是建立现代地图学的科学体系;第二个阶段是出现了计算机辅助制图;第三个阶段将人工智能与专家系统应用到制图领域。早在20世纪80至90年代,国内外学者就开始探讨人工智能在地图学中的应用。

地图制图专家系统一度成为人工智能与地图学结合领域中的热点问题,是人工智能在地图学研究中最接近实用、最为活跃的研究领域之一。专家系统在地图制图领域中,广泛用于地图设计和生产、矢量和栅格制图要素的自动提取、地图投影选择、地图要素表示等级确定、地图要素的自动制图综合等。

专家系统的实现难度在于首先需要收集地图专家的知识经验,总结成可供计算机使用的知识库的形式(例如决策树),然后需要为计算机系统设计一套推理的流程。在许多时候,地图学中的知识无法通过简单的IF语句、决策树或数学公式表达,这就导致了针对某些制图学问题的知识库难以构建和推理流程难以构建,这是专家系统未能取得突破性成功的重要原因之一。总而言之,早期研究专注于使用人工智能方法应用到传统的地图学任务中,尝试实现部分制图过程的自动化。

2.2 地图内容生产的智能化发展

内容生产的发展通常可以分为3个阶段:专家生成内容(Professionally Generated Content,PGC)、用户生成内容(User Generated Content,UGC)、及AI生成内容(AI Generated Content,AIGC),地图内容从产生模式同样也可以分为:PGC地图阶段、UGC地图阶段、AIGC地图阶段。

阶段 特点 创作主体 规模 效率 质量 成本
PGC地图 专家生成内容 地图专家 生成慢
UGC地图 用户生成内容 用户 生成快
AIGC地图 人工智能生成内容 人+机器 生成快 不稳定

PGC地图阶段:即传统的地图编制阶段,是由地图专家制作生成专业地图的过程,虽然这些地图的质量得到了保证,但毕竟地图专家数量有限,这些地图生产的周期长、成本高,地图产品的数量也有限,并未形成规模。此外,由于专业地图的创作者是地图专家,而地图用户是被动的使用者,只能在有限的选择范围内获得信息,并未形成制图者和读图者之间良好的互动关系。

UGC地图阶段:随着互联网的兴起,地图的制作变得容易,普通大众也可以制作地图,拉低了地图制作的专业门槛,各类用户产生的地图涌现,虽然地图作品生成快、成本低,但是由于用户水平层次不齐也造成地图创作内容质量不能得到保证。

AIGC地图阶段:进入智能化时代,人与机器都将成为制图与读图的主体,通过人工智能算法,能够快速地、低成本、大规模的生成地图作品,但是也存在地图作品质量不稳定等问题。

总的来说,目前地图内容的产生仍处于专家生成内容和用户生成内容的阶段为主,正在向人工智能生成内容阶段发展。

文本生成地图、地图生成解释和地图风格迁移示例

图1 文本生成地图、地图生成解释和地图风格迁移示例

生成式人工智能新技术的发展为地图学带来了新的机遇与挑战。生成式人工智能在现阶段可以通过3种形式产生地图内容,分别是文本生成地图(txt2map)、地图生成解释(map2txt)、地图风格迁移(map2map)。人们已经可以使用ChatGPT通过输入一段文字来生成地图,也可以通过ChatGPT上传一副地图的图片来产生一幅地图的文字解释,甚至还可以用对抗生成网络(GAN)从图片实现地图风格的迁移。

很显然由于这些功能并非针对地图,而是针对图像数据的所设计和研发,尽管借助人工智能方法或工具已经可以在一定程度上完成地图生成和地图解释,但目前AI生成的地图所生成的地图虽然快速但是较为随机且不稳定,并非像地图那样是真实世界的映射;AI读图做出的解释缺乏上下文信息和针对性;地图风格的迁移更像艺术地图,而非科学地图,缺乏实用性。此外,目前基于AI的智能读图和智能制图大部分是黑箱模型,人们无法对其机理进行解释和说明。

3 地图传输模型的智能化发展

3.1 地图传输模型

地图的制作和应用是地图学的2个核心问题和任务。地图传输模型(Map Communication Model)借鉴了信息论的观点,描述了地图信息的创造和传播的整个过程,把地图视为一种交流工具,以优化地图的效率。地图作为传输方式的思想是Keates在1964年在伦敦的会议上引入的,但最早的地图传输模型是由Moles在1964年所设计,对地图传输模型发展最有影响力的早期贡献是由Koláčný在1969年提出。

Koláčný以制图者对现实有选择性的观察为模型的起点,通过地图符号的语言,实现了现实多维知识模型向地图信息的转化,这些信息被读图者读取并理解,形成对现实世界的认知,整个地图传输模型的过程的核心概念是地图信息的传递。总而言之,地图传输模型描述了制图者把对客观世界的认识加以选择、分类、简化等信息加工并经过符号化,通过地图传递给用图者,用图者经过符号识别,同时通过对地图的分析和解译形成对客观世界的认识的过程。

随着数字制图的发展,今天的地图制作和编辑过程对用户和制图者的审美判断更加敏感,审美也不足以区分专业制图人员和业余人员。换言之,制图学的门槛在新兴数字制图工具的引领下降低了,也使制图效率得以提高。除此之外,许多新型地图产品也陆续出现,如多媒体地图、三维地图、增强现实地图等,这些产品区别于传统意义上的地图。总而言之,数字时代的发展和数字地图的出现改变了传统的地图学的范式,传统的地图传输模型各个环节的内涵也发生了重大改变。因此,需要提出一种新的地图传输模型来适应数字化时代。

3.2 智能地图传输模型

随着地图学的发展已经进入了智能化时代,人工智能可以在地图传输模型的各个环节结合,这些结合也是地图学未来智能化发展的方向。在传统的地图传输模型中,制图和读图的主体都是人。在经历了传统地图时代、数字地图时代后,人与机器共同成为制图的主体。进入智能化时代,人与机器都将成为制图与读图的主体,智能制图与智能读图应运而生。

智能地图传输模型

图2 智能地图传输模型

Koláčný所提出的经典地图传输模型在AI的加持下衍生为智能地图传输模型,包括4个环节:

制图信息智能获取

通过人工智能方法采样、收集现实世界地理环境的信息,经过加工、筛选成结构化的用于制图的信息

智能制图

制图信息通过色彩、符号、分级等表示方法智能生成地图的过程

智能读图

读图者利用人工智能方法,结合地图语言、领域知识和个人理解对现实世界认识的过程

地图信息智能解读

利用人工智能对地图做出解释,从而获得对现实世界的认知和理解

3.3 AI与地图的应用结合模式

人工智能方法以"AI+地图"的模式与地图应用开展结合。AI辅助制图数据的获取,极大的丰富了数据源,帮助制图者快速的获取大量制图数据。AI辅助制图流程,加速制图的流程,以智能制图环节为例,制图综合是制图学中的传统任务,过去严重依赖于知识和经验,而人工智能模型(如深度卷积神经网络)可以帮助解决一部分制图综合任务。

人工智能方法与地图的应用结合

图3 人工智能方法与地图的应用结合

风格迁移则是计算机视觉和图形学兴起后流行的一种技术,通过将一个图像的内容与另一个图像的风格相结合来生成新图像,学者们把风格迁移应用于地图图像上,从而催生了地图风格迁移(map style transfer)。AI辅助读图则通过地图文本提取、符号识别、内容识别等方式增强对地图的理解。由此可见,人工智能技术改变了传统地图学的制图和读图的方式方法,还催生了新的制图和读图领域。

4 智能地图制图学的研究进展

4.1 制图智能信息获取

进入智能化时代,我们可以更加便捷和高效地利用地理空间智能方法从现实世界采样和提取更加精确的信息。目前,制图信息获取智能化实现主要体现在遥感图像的目标检测、地理大数据挖掘等方面。

近年来,许多基于深度学习的目标检测方法的方法被提出,这些方法显著提高了目标检测的速率和准确度。一般来说,现有的用于目标检测的深度学习方法可以根据是否生成候选区域分为两种类型,分别是基于区域建议(region-proposal-based)的方法和基于回归(regression-based)的方法。

很多研究小组开发了对地观测的图像数据集(例如RSOD、DOTA、DIOR等),人们使用可以这些公开的数据集来提取特定的地物,这意味着图像中额外的信息被发现了,人们不需要通过先验知识和经验来推断一幅图像的内涵。这些结果在一定条件下,也可以作为制图的数据来源。

深度学习技术已经被用于卫星图像解译、卫星图像分析等任务。一些过去无法想象的全球尺度制图数据获取,如全球的树木检测、全球的建筑制图成为可能。人们还利用深度学习从其他来源的地理空间图像提取信息,例如街景照片、扫描历史地图、情绪制图等。此外基于某种移动设备(如机器人、无人机、手机等)的SLAM(Simultaneously Localization and Mapping)技术可以实现从一个未知环境里的未知地点出发,在运动过程中通过传感器(如激光雷达、摄像头等)观测定位自身位置、姿态、运动轨迹,再根据自身位置进行增量式的地图构建,从而达到同时定位和地图构建的目的。

4.2 智能制图

众多研究者对智能制图的理论和方法进行了广泛的探讨,包括:地图风格迁移(map style transfer)、使用ChatGPT等人工智能工具制图、制图综合等。

随着生成对抗网络(GAN)模型在图像领域风格迁移的广泛应用,地图的风格迁移也成为当前的研究热点,国内外学者开展了大量研究。Kang等使用了2个GAN模型(Pix2Pix和CycleGAN)从Google Maps、OpenStreetMap和艺术绘画中识别风格,并迁移于未渲染的矢量数据中,随后对地图风格迁移的效果进行了评估。

地图风格迁移在实现风格转换方面效果显著,但现有的风格迁移大多为栅格的迁移,在地图细节上经常出错。除了栅格形式地图的风格迁移,吴明光等比较了矢量和栅格的地图风格迁移,认为基于栅格的迁移方法很难解析出地图内容和制图规则,容易出现内容不一致的问题,地图可读性较低;基于矢量的迁移方法可以嵌入制图知识规则来区分要素内容,风格迁移结果可读性较高。

自ChatGPT等大语言模型(Large Language Models, LLM)问世以来,人们对于人工智能平台的关注日渐增加,许多地图学家也尝试将它们用于制图实践。例如,Tao等探讨了利用ChatGPT制作地图的可能性。在制作地图的整个流程中,通过与ChatGPT交互,输入提示词(prompt),驱动其使用读取地理空间数据并绘制最终地图,ChatGPT生成一段Python代码来完成地图的绘制。

4.3 智能读图

智能读图是指利用人工智能方法,结合地图语言、领域知识和个人理解对现实世界认识的过程。随着计算机视觉和自然语言处理技术的发展,智能读图在地图符号识别、地图文本提取、地图内容识别等方面取得了显著进展。

地图符号识别是智能读图的基础任务之一,传统的方法主要依靠模板匹配、特征提取等技术,而深度学习方法如卷积神经网络(CNN)在地图符号识别方面表现出更好的性能。例如,研究者使用深度学习方法自动识别历史地图中的地图符号,实现了对历史地图的自动解析。

地图文本提取是智能读图的另一个重要任务,传统的OCR(光学字符识别)技术在地图文本提取方面面临诸多挑战,如文本方向多变、字体多样、背景复杂等。深度学习方法如EAST(Efficient and Accurate Scene Text Detector)、CRAFT(Character Region Awareness For Text Detection)等在地图文本提取方面取得了较好的效果。

地图内容识别是智能读图的高级任务,涉及到对地图整体内容的理解和解读。随着大型语言模型(如GPT-4)和多模态模型(如CLIP)的发展,地图内容识别的能力得到了显著提升。例如,用户可以上传一张地图图片,通过ChatGPT等工具获取对该地图的文字描述和解释。

4.4 地图信息智能解读

地图信息智能解读是指利用人工智能对地图做出解释,从而获得对现实世界的认知和理解。随着自然语言处理技术的发展,特别是大型语言模型的出现,地图信息智能解读取得了显著进展。

大型语言模型(如GPT-4)具有强大的文本理解和生成能力,能够根据地图内容生成详细的文字描述,包括地理特征、空间分布、趋势变化等。例如,用户可以上传一张人口密度分布图,通过ChatGPT获取对该地图的解读,包括人口密度高低区域的分布、可能的原因分析等。

多模态模型(如CLIP)能够同时处理图像和文本,实现图文匹配和互译。这类模型可以根据文字描述找到相匹配的地图,或者根据地图生成相应的文字描述。例如,用户可以输入"显示中国东部沿海城市分布的地图",系统能够从地图库中找到最匹配的地图。

知识图谱技术能够将地图中的实体和关系进行结构化表示,支持复杂的推理和查询。例如,将地图中的城市、道路、河流等实体及其关系存储在知识图谱中,用户可以进行如"找出位于两条河流之间且人口超过100万的城市"这样的复杂查询。

尽管地图信息智能解读取得了一定进展,但仍面临诸多挑战,如解读的准确性、完整性、专业性等。特别是对于专业地图(如地质图、气象图等),需要结合领域知识进行更深入的解读。

5 智能地图制图学的挑战与展望

尽管人工智能在地图学中的应用取得了一定的进展,但智能地图制图学仍面临诸多挑战,同时也蕴含着广阔的发展前景。

主要挑战

缺乏训练数据集

地图学领域缺乏大规模、高质量的训练数据集,这限制了深度学习模型的训练和应用。特别是对于专业地图(如地质图、气象图等),相关的训练数据更为稀缺。

模型泛化能力不足

当前的人工智能模型在处理不同风格、不同类型的地图时,泛化能力不足。例如,在一种地图上训练的模型可能无法很好地应用于另一种地图。

模型可解释性差

深度学习模型通常被视为"黑箱",缺乏可解释性。在地图制图这样需要精确和可靠的领域,模型的决策过程难以理解和验证,这限制了其在关键应用中的使用。

制图规则与AI的结合

地图制图有着丰富的专业知识和规则,如何将这些知识有效地融入人工智能模型中,是一个重要的挑战。

未来展望

构建地图学专用数据集

未来需要构建更多针对地图学的专用数据集,包括不同类型、不同风格的地图,以支持深度学习模型的训练和测试。这些数据集应覆盖地图制图的各个方面,如符号设计、颜色选择、文本布局等。

发展地图知识图谱

地图知识图谱可以将地图制图的专业知识和规则进行结构化表示,为人工智能模型提供指导。通过知识图谱,可以实现知识驱动的智能制图,提高制图的准确性和专业性。

多模态地图理解与生成

未来的研究可以探索多模态模型在地图理解与生成中的应用,实现文本、图像、地图等多种模态之间的转换和融合。例如,根据文字描述生成地图,或者根据地图生成文字描述。

人机协同制图

人机协同制图将成为未来的重要方向,人类提供专业知识和创意,人工智能提供效率和一致性。通过人机协同,可以实现更高质量、更高效率的地图制作。

6 结论

新一代人工智能技术的发展为地图学研究带来了新的机遇与挑战。随着AIGC为代表的新一代人工智能的快速发展,地理空间智能(GeoAI)技术在解决传统制图学任务方面展现出比传统方法更好的性能,推动了智能地图制图学的形成与发展。

地图内容的产生正在从专家生成内容(PGC)和用户生成内容(UGC)阶段向人工智能生成内容(AIGC)阶段发展。人工智能与地图传输模型的结合衍生出智能地图传输模型,包括制图信息智能获取、智能制图、智能读图、地图信息智能解读四个环节。

尽管智能地图制图学取得了一定的进展,但仍面临诸多挑战,如缺乏训练数据集、模型泛化能力不足、模型可解释性差等。未来的研究方向包括构建地图学专用数据集、发展地图知识图谱、探索多模态地图理解与生成、推进人机协同制图等。

总之,人工智能驱动下的地图学研究正处于快速发展阶段,将为地图制图和地图应用带来革命性的变化,推动地图学向更加智能化、个性化、高效化的方向发展。

引用格式

张岸,朱俊锴.新一代人工智能驱动下地图学研究的机遇与挑战[J].地球信息科学学报,2024,26(1):35-45. [ Zhang A, Zhu J K. Opportunities and challenges of cartography research driven by new generation artificial intelligence[J]. Journal of Geo-information Science,2024,26(1):35-45. ] DOI:10.12082/dqxxkx.2024.240128

以上内容由AI自动生成,内容仅供参考。对于因使用本网站以上内容产生的相关后果,本网站不承担任何商业和法律责任。