无人平台对复杂环境的自主认知能力是制约其广泛应用的关键问题,已成为当前地图学、人工智能、机器人等领域的研究热点。本文基于地图学的视角,交叉融合人工智能、机器人和认知科学的相关研究思路与成果,借鉴心象地图的作用功能,提出适用于无人平台认知环境的新型地图——机器地图,并对其特征进行了分析。
类比心象地图的构建与运用机制,结合人工认知系统的设计决策点和核心认知能力,给出了机器地图概念模型的设计原则,提出"两环三图"的概念模型。该模型说明了机器地图与无人平台的内在联系,并勾勒出机器地图的功能部件与运行逻辑,为开展机器地图研究提供顶层框架和理论指导;类比心象地图的结构组成,提出了包含感知地图、工作地图和长时地图的机器地图逻辑构成,并分析了3类地图的内容与转化关系。
在结论部分指出了机器地图的双向促进研究路线。机器地图的研究,能够提升无人自主平台对于复杂环境的认知和学习能力,也为智能时代地图学的发展探索新路径,具有十分重要的意义。
随着人工智能、5G、物联网等技术的发展,机器人与人共融共生态势已悄然显现。无人自主平台(简称无人平台)作为一类典型的机器人系统,已广泛应用于无人作战、应急搜救、自动驾驶、导游服务等领域。例如自动驾驶汽车已经开始进入开放环境路测,搭载传感器的无人机可在野外环境中自由穿行,无人水面舰艇也为远海科考实验、反潜侦察提供了新手段。
美军从实战应用的角度,归纳出无人平台需要具备的5个共性自主能力,即思维、关注、移动、沟通和作业,以及制约其自主能力生成的5个技术瓶颈,包括:环境模型简单、感知对象与任务无关联、自主操控能力弱、任务理解和角色共享不够、知识学习能力不足等。这五项技术瓶颈中前两项与环境建模有关,后三项与环境学习有关。可见,提高对复杂环境的自主认知能力,已成为推动无人平台发展的核心关键。
当前,机器人与计算机视觉领域对无人平台的环境建模与学习开展了十分有效的研究。Rosinol等提出了3D动态场景图,在多源传感器实时感知数据基础上,将地理实体、位置、结构及其关系进行建模形成环境语义模型。Zheng等学者设计了一个端到端的概率深度网络用于对复杂环境进行建模。该网络是包含多个抽象层次和空间尺度的统一深度学习网络,可对大规模地理环境建立拓扑视觉语义模型。
近年来,许多无人驾驶厂商和学者高度关注从顶视方向构建无人平台环境模型,提出了BEV(Bird's Eye View)模型。例如,美国无人驾驶厂商特斯拉公司利用BEV模型将多通道侧视方向的深度视觉特征投影转换到顶视方向,形成统一的顶视环境特征模型。但随着无人平台从简单环境走向复杂现实环境,现有以深度学习为代表的研究普遍面临着鲁棒性、适应性以及学习持续性等方面的问题。
测绘地理信息领域在自动驾驶环境模型方面也进行了持续研究,其典型成果是高精地图。刘经南等在经典的柯拉斯尼地图信息传输模型六元组基础上,提出了用七元组表示智能高精地图信息传输模型,并引入用户认知特征及需求构建智能高精地图模型。詹骄等围绕自动驾驶地图的数据标准,从数据结构、数据模型、地图表示、协同应用等方面进行了对比分析,对自动驾驶地图标准编制提出了原则建议。然而高精地图主要面向城市行车道路环境进行设计,且其测图、制图、用图主体并非一体,技术架构难以支撑对复杂环境的自主认知与运用。
从人类的空间认知机理看,人类具备建立复杂环境心象地图的先天能力,并运用该地图完成导航、规划、距离方位判断等各种空间任务。心象地图的图形记录主导了人类最早的地图绘制,促成了实用地图的产生,形成了大脑内外虚实结合的两套互补的地图系统,为人类认知环境、应用环境提供了有力支撑。实用地图具有严密的环境建模基础,心象地图具有强大的实况认知功能,能否将这两套地图系统在机器人"大脑"中实现有机融合,以提高机器人对复杂环境的建模与学习能力?
为此,本文提出"机器地图(Machine Map)"新概念:一种适用于无人平台认知理解环境信息、建立环境认知模型、进行空间推理决策的新型地图。借鉴心象地图形成机理以及地图学、人工智能、机器人等相关学科领域研究成果,提出机器地图的概念模型,为开展机器地图研究提供顶层框架和理论指导。
机器人与人工智能等学科,本身受生物行为、大脑工作机理等启发逐步发展而来,近年来又重新强调生物启发,是因为这对未来正确发展有很好的启迪作用。心象地图被认为是人类对环境的心理表征,能够支持路线规划、变更等各种空间行为。近年来神经科学研究证实了"心象地图"的存在。本文认为,机器地图与心象地图可视为不同主体空间认知的结果和工具,综合分析心象地图的研究成果,可为机器地图研究提供参考。
图1 心象地图的构建与运用过程
心象地图本质上是人类应对复杂生存环境而形成的生理机制,是大脑、身体和环境之间相互作用的结果,具有具身认知和持续学习的特点。心象地图的构建与运用过程可以用"感知-行动环"来概括(图1)。心象地图的构建起始于人对环境的感知,并作用于人的行动,而人的行动及新的感知信息又可以修正心象地图,从而再次作用于行动,形成一个连续不断的过程。
在此过程中嵌和着一个不断融合感知信息,进行诸如自我中心参考系和全局中心参考系之间的转换、视域外物体的距离与方向计算等复杂信息加工,形成多层次、多类型环境表征并指引空间行为的循环过程。近年来神经科学研究部分说明了人脑内部对心象地图的加工机制。人类大脑中存在着的位置细胞、边界细胞、网格细胞,奠定了人类识别自身位置、建立环境参考框架的基本模式。内嗅皮层、海马体和相关脑区形成的复杂记忆神经环路是空间导航、推理、决策等认知智能的核心物质基础,用来处理、整合感知和运动等多源信息。
图2 记忆信息三级加工模型
记忆系统是探索心象地图结构组成的关键。通常认为,人类的记忆系统由感觉记忆、短时记忆和长时记忆组成(图2)。为了解释人在进行高级认知活动时所需的暂时信息加工与存储机制,有学者提出工作记忆的概念,以扩展原有的记忆三级模型。
感觉记忆也称为瞬时记忆,是在感觉刺激简短呈现后,以快速衰减的刺激形式短暂保留感官痕迹的短期记忆,持续时间在几百毫秒量级,可被重新编码为工作记忆和长时记忆。工作记忆对感觉记忆中的各种信息进行加工处理,形成既满足各种任务需求,也适宜长时记忆的各种信息形式。
在工作记忆中,存在多个单独存储不同形式信息的缓冲器,即语音回路、视觉空间模板和情境缓冲器。情境缓冲器存储了事件发生的时间、地点、事件、任务等要素,服务于后期有意识的回忆。空间工作记忆可以支持追踪周围的少量事物和在新环境中导航。但在熟悉的环境中,利用长时记忆中被统称为基于习惯的记忆系统、采用简单的联想奖励学习机制进行导航更有效。
长时记忆可以编码大尺度空间,将局部区分为一些有意义的块、将持续的经验流分割为时空情境记忆,并使用拐点、决策点等将局部记忆与全局记忆进行关联。长时记忆中也包含环境结构的知识框架,即图式。图式超越了直接经验,可以支持推理和泛化,允许人们预测不同场景中应采取的行动。
上述有关心象地图的研究及推论,对机器地图的构建具有重要启发。借鉴心象地图的具身性来思考机器地图,需要从环境、无人平台及二者间的交互出发,综合考虑环境与任务的类型和复杂性,设计更为合理的架构。心象地图所具有的分布计算、灵活转换的特点提示我们机器地图应具有多种形式,其构建过程可以分解为一组存储与计算单元及其信息流转过程。机器地图还应借鉴注意力机制,以提高无人平台环境认知的效率与效果。
机器地图可视为无人平台的"空间认知脑",在数学基础、表达模型和信息综合方面与实用地图具有类似特征,除此之外还具有以下独特性:
一种能够通过传感器感知环境和自身状态,实现在开放环境中面向目标的自主运动,从而完成特定任务功能的机器人系统。
强调由无人平台自主完成测图、制图、用图,将建图逻辑贯穿测、制、用图全过程。
具有持续自主学习的机制,可持续进行行为模式、建图内容与方式、更新时机等方面的学习,进而改变自身的结构和行为方式。
可指引无人平台完成相关空间操作,如导航、空间决策、推理计算等。在引导空间行为时,处于更新与指引同步状态中。
机器地图的时敏性、比例尺、精度、内容丰富度等方面会根据距离、任务关注点、相关性等进行动态调整,呈现出非均衡的特点。
借鉴心象地图的认知机理设计机器地图概念模型,需运用人工认知系统建模方法,其技术实现途径有2种:① 构建某种形式的计算系统(A Computational System);② 构建生物启发系统(A bio-inspired system),通常2种技术途径会融合在一起。David Vernon认为建模认知系统需要在以下4点做出决策:① 计算系统和生物启发之间的平衡;② 生物模型的抽象水平;③ 大脑、身体和环境的相互依赖关系;④ 系统所能完成的行为和采用机制之间的关系。本文从上述4个要点来分析机器地图的基本定位及概念模型设计原则。
表1 机器地图概念模型设计原则
决策点 | 机器地图概念模型设计原则 |
---|---|
计算系统与生物启发的平衡 |
|
生物模型的抽象水平 |
|
大脑、身体和环境的相互依赖关系 |
|
系统行为与采用机制的关系 |
|
根据上述设计原则,本文基于人工认知系统的7种核心认知能力:感知、注意力机制、行为选择、学习、记忆、推理和元认知,提出"两环三图"的概念模型,从更为抽象的角度说明机器地图的基本架构、构成模式与信息加工过程等。
图3 机器地图"两环三图"概念模型
如图3所示,无人平台在不同环境中自主完成各类任务,可以看成是由"感知-推理-注意力学习-行为生成-行为执行"组成的迭代环,构成模型的外环。而机器地图可以看作是无人平台的"空间认知脑",主要包括存储单元与核心计算单元,各单元间具有多种信息传输过程,构成模型的内环。外环感知的环境信息成为内环处理的主要信息。内环的核心计算单元与外环的主要计算单元相对应,并实现与外环的交互。内外环交互是机器地图持续自主学习能力聚集与释放的关键,也是无人平台产生智慧的重要环节。
在内环中,根据时间敏感度、空间尺度以及内容抽象度的差异,划分为三类地图,即感知地图、工作地图和长时地图。三类地图的构建与运用由空间推理单元、空间注意力学习与编码单元、空间行为生成单元以及生成器负责。空间推理单元可视为运行逻辑中枢,主要负责用图需求理解、建图任务生成、地图建图评价、任务决策辅助等计算。空间注意力学习与编码单元则负责依据工作地图和长时地图中的信息以及空间推理单元得出的任务要求,计算出重点关注的对象、关系、模式等。空间行为生成单元则在空间推理单元、空间注意力学习与编码单元和工作地图的支撑下完成空间行为的生成,并将行为序列提交给无人平台的行为生成单元,进行各种行为的协调与组合。
三类地图的逻辑构成与心象地图中的记忆系统相呼应,分别对应感觉记忆、工作记忆和长时记忆。感知地图是无人平台对环境感知的直接结果,主要包含由多源传感器获取的环境信息,具有短暂性、实时性和碎片化特点。工作地图是无人平台进行当前任务所需的环境表征,主要包含任务相关的环境信息,具有任务导向性、综合性和短期持久性特点。长时地图是无人平台对环境的长期记忆,主要包含环境的结构性知识和经验,具有抽象性、稳定性和长期持久性特点。
基于"两环三图"概念模型,本节进一步分析机器地图的逻辑构成,即感知地图、工作地图和长时地图的内容特征及其转化关系。
定义:无人平台对环境感知的直接结果,是环境信息的初级表征。
特点:
内容:包含视觉、激光、雷达等多源传感器获取的原始或低级处理的环境信息,如物体位置、形状、颜色、距离等。
定义:无人平台进行当前任务所需的环境表征,是环境信息的中级表征。
特点:
内容:包含任务相关的环境信息,如导航路径、障碍物分布、目标位置、决策点等,以支持当前任务的执行。
定义:无人平台对环境的长期记忆,是环境信息的高级表征。
特点:
内容:包含环境的结构性知识和经验,如地标、区域分类、路网结构、环境模式等,以支持复杂的空间推理和决策。
三类地图之间存在着复杂的信息流转和转化关系,形成了机器地图的动态运行机制:
通过空间注意力学习与编码单元,将感知地图中的原始信息进行筛选、整合和编码,提取与当前任务相关的环境信息,形成工作地图。这一过程涉及注意力机制、特征提取和信息融合等。
通过空间推理单元,将工作地图中的任务经验和环境知识进行抽象和泛化,提取环境的结构性特征和规律,更新长时地图。这一过程涉及模式识别、知识表示和记忆巩固等。
在任务执行前,通过空间推理单元,将长时地图中的相关知识和经验提取出来,与当前感知信息结合,初始化或更新工作地图。这一过程涉及知识检索、情境匹配和预测等。
这种动态的信息流转机制使得机器地图能够在不同时间尺度和空间尺度上表征环境,既能快速响应环境变化,又能积累长期经验,从而支持无人平台在复杂环境中的自主认知和决策。
值得注意的是,三类地图的转化不是简单的信息传递,而是涉及复杂的信息处理过程。例如,从感知地图到工作地图的转化需要考虑当前任务需求,从工作地图到长时地图的转化需要考虑信息的重要性和通用性,从长时地图到工作地图的转化需要考虑当前环境与已知环境的相似性。这些处理过程由空间推理单元、空间注意力学习与编码单元等计算单元负责,体现了机器地图的智能性和适应性。
本文基于地图学的视角,交叉融合人工智能、机器人和认知科学的相关研究思路与成果,借鉴心象地图的作用功能,提出了适用于无人平台认知环境的新型地图——机器地图,并对其特征进行了分析。类比心象地图的构建与运用机制,结合人工认知系统的设计决策点和核心认知能力,给出了机器地图概念模型的设计原则,提出了"两环三图"的概念模型。该模型说明了机器地图与无人平台的内在联系,并勾勒出机器地图的功能部件与运行逻辑,为开展机器地图研究提供顶层框架和理论指导。类比心象地图的结构组成,提出了包含感知地图、工作地图和长时地图的机器地图逻辑构成,并分析了3类地图的内容与转化关系。
机器地图研究需要采取双向促进的研究路线:一方面,通过概念模型的演绎推理,促进对机器地图内涵与架构的理解;另一方面,通过机器学习与人工智能技术的不断发展,突破无人平台环境认知能力的限制,不断完善机器地图的技术框架。机器地图的研究,能够提升无人自主平台对于复杂环境的认知和学习能力,也为智能时代地图学的发展探索新路径,具有十分重要的意义。
游雄,贾奋励,田江鹏,等.机器地图及其概念模型[J].地球信息科学学报,2024,26(1):25-34. [ You X, Jia F L, Tian J P, et al. The Machine Map and its conceptual model. Journal of Geo-information Science, 2024,26(1):25-34. ] DOI:10.12082/dqxxkx.2024.220837
以上内容由AI自动生成,内容仅供参考。对于因使用本网站以上内容产生的相关后果,本网站不承担任何商业和法律责任。