摘要
【意义】自然资源时空大数据作为自然资源开发利用的泛在观测,蕴含了丰富的资源要素分布、时空过程演化与关联关系知识。
【进展】本文聚焦于自然资源时空大数据挖掘与知识服务,探讨了5种自然资源时空大数据挖掘方法及其知识服务重要应用。首先,分别阐述了时空聚类分析、关联挖掘、异常探测、预测建模和地理风险评估的核心思想、技术体系、方法流程及其在自然资源管理和国土空间决策中的重要应用。然后,提出了描述型、诊断型、预测型和决策型四类自然资源时空知识服务体系,为资源现状监测、规划用途管制和防灾减灾等重大应用提供重要支撑。最后,指出了当前自然资源管理正从数据汇聚分析迈向以知识为核心的智能化服务,逐渐形成大数据-大分析-大知识-大服务的研究与应用范式。
【展望】未来工作将延拓数据与知识协同驱动的挖掘方法,着重解决时空知识库与知识服务面临的标准化问题,并探索生成式大模型等前沿技术在自然资源领域中的潜在应用,为自然资源信息化、智能化建设提供新动力。
关键词:自然资源;时空大数据;数据挖掘;时空知识;知识服务;研究进展
1 引言
自然资源是人类社会赖以生存发展的重要物质资料,涵盖了土地、矿产、森林、草原、湿地、河流、湖泊、海洋等多种类型,支撑着社会经济和政治文化等人类文明的可持续发展。我国国土面积大而人均自然资源占有量少,自然资源和人类活动分布异质性高,导致资源配置不平衡、利用效率偏低。忽视自然资源系统复杂关系与时空态势的盲目开发极易诱发资源短缺、环境恶化、气候气象异常等威胁人类社会安全和国土空间质量的重大恶性事件。因此,摸清自然资源现状"家底"与变化趋势是进行科学生产建设、实现社会可持续高质量发展的重要基石。
当前,"空天地海"一体化的自然资源时空观测网基本建成,实现了"山水林田湖草沙"等自然资源要素全天候、高覆盖、高时效、高精度观测,极大推进了我国自然资源要素时空大数据库(即"一张图"系统)构建集成。随着对地观测、移动通讯和物联网等移动感知技术快速发展,基于位置的服务记录了手机信令、车辆轨迹、旅游打卡、监控摄像等人类活动时空大数据。此外,自然资源相关部门的图、表、文、卷等国土空间治理与业务管理数据汇聚,已经成为记录自然资源开发利用、安全保护、修复建设的流式业务时空大数据。如今,自然资源要素时空大数据、人类活动时空大数据和流式业务时空大数据共同构成了海量、多源、异构、多模态的自然资源时空大数据体系(图1)。自然资源时空大数据实时反映了国土空间建设和社会经济发展等基本国情态势,成为调整国家战略、保障民生服务、解放新质生产力的重要战略资源。

图1 自然资源时空大数据体系
"数字中国"战略引领下,《自然资源部信息化建设总体方案》提出数据治理和应用服务两阶段战略规划,成为国家方针、战略政策和国家安全的基础支撑。自然资源建设目标不仅聚焦时空数据汇聚管理,更强调实现数据-信息-知识-决策的赋能跨越。深入挖掘自然资源时空大数据隐含的多视角时空信息,揭示自然资源与人类活动的复杂时空关系、要素配置格局和时空演化规律等时空知识,能够有效提升资源确权管理、资源开发利用、资源执法监察、国土空间规划与修复等管理与决策方案的科学性与可靠性。
国土空间是国家主权及利益管辖的、自然资源要素和人类活动行为相互作用的空间载体和耦合系统,其中,自然资源要素是时-空-属性构成的广义时空中相互作用的地理对象。因此,时空大数据挖掘是实现由自然资源立体观测时空大数据到国土空间全周期监测、信息化建设、智慧化决策等应用服务战略实现的重要桥梁和关键途径。虽然自然资源时空大数据发展迅猛,但是自然资源信息-知识-决策的智能转化仍存在一些问题需要仔细探讨:
自然资源时空大数据体量增长、维度复杂、关系多样,人工驱动的传统数据统计分析手段难以深入认知时空分布格局、厘清要素交互关联、推理演化发展过程。哪些数据挖掘方法能够深度支撑自然资源时空大数据的多维信息提取与深层知识发现?
相比其他领域依赖数据规模的数据挖掘理论,自然资源时空大数据挖掘更强调时空机理的理解与认知、更关注时空知识的协同与利用,具有鲜明的知识驱动服务需求。当前时空数据挖掘方法体系为自然资源智慧化监管决策提供了哪些知识服务?
大数据时代自然资源时空大数据体系建设与数据挖掘方法研究初具成效,数据-信息-知识-决策的智慧跨越与链式联通仍处于关键节点,当前全周期研究范式和实现逻辑是什么?
鉴于此,本文从地理信息科学视角,梳理自然资源时空数据挖掘方法体系,重点阐述5类时空数据挖掘方法;尝试厘清自然资源层次化时空知识体系与服务应用;最后,针对当前自然资源信息化建设关键时期的研究趋势和未来范式进行讨论。
2 自然资源时空大数据挖掘方法
新时期地理学使命在于研究自然要素与人文要素等地理对象的相互作用关系和时空分异规律,进而预测未来演化过程。作为国土空间中自然资源要素的时空状态观测,自然资源时空大数据天然适合利用地理时空观的数据挖掘方法揭示深层时空规律,为资源管理、利用与规划提供科学全面的决策依据,支撑实现人地关系协调发展的核心目标。
2.1 自然资源时空数据挖掘方法体系
大数据时代,自然资源时空数据挖掘逐渐成为理解资源对象时空分布、变化过程和关联关系的关键手段。与传统的自然资源调查统计相比,时空大数据挖掘方法不仅适应更大数据量、更高分辨率、更快响应效率,还能更全面地揭示更隐含的规律、更复杂的关系、更长期的过程。基于自然资源大数据的丰富性和国土空间规划的独特性,本文将重点梳理适应自然资源时空大数据的挖掘理论与方法体系(图2),包括时空聚类分析、时空关联挖掘、时空异常探测、时空预测建模和地理风险评估。

图2 自然资源时空数据挖掘方法体系
自然资源时空数据挖掘方法不仅可以作为单独开发应用的技术手段,还可以相互协作集成构建工作流,共同回答关于自然资源"何时、何地、何种关系、如何变化"等复杂问题。例如,时空聚类分析能够识别自然资源的聚集模式,进而了解区域资源的局部丰富程度,同时可以为其他挖掘方法提供分异性区划等先验认知;时空关联挖掘可以发现自然资源间互利共生或生存竞争等协同模式,同时为时空异常探测提供变异程度的基本参照,指导发现资源利用过程中潜在的突发事件或异常变化。
2.2 自然资源时空数据挖掘方法流程
2.2.1 时空聚类分析
时空聚类分析旨在根据自然资源要素的时空邻近性和属性相似性,将其划分为簇内特征相似、簇间特征相异的对象集合或聚集时空区域。
主要方法类型:
- 基于划分的方法
- 基于层次的方法
- 基于密度的方法
方法流程:
时空邻域构建
基于拓扑关系、时空距离、网络关系或交互关系等构建资源要素的时空邻近性约束
聚类结构探测
在时空邻近性约束基础上,利用各类方法提取属性相似的簇结构
聚类检验分析
利用时空统计检验模型参数或聚类指标的显著性和有效性
2.2.2 时空关联挖掘
时空关联挖掘旨在从自然资源时空数据集中识别不同类型资源要素或与人类活动之间的稳定时空关系及其时空范围,对于理解和发现资源要素间时空交互机制具有重要指示意义。
关联关系类型:
- 定性关联关系(频繁模式、空间同位模式、时空同现模式等)
- 定量关联关系(回归方程、机器学习的数值拟合模型等)
方法流程:
时空关系构建
利用网格划分、Voronoi图划分等事务化方法或要素半径提取等非事务化方法构建资源要素间的邻近关系
时空关联度计算
设计频繁度计算函数,度量事务集内项集或者连续时空内对象集的关联程度
时空关联模式判定
采用频繁度阈值、有参建模或者无参推断的方式,推断资源要素子集的关联强度是否足够显著
2.2.3 时空异常探测
时空异常探测旨在发现偏离正常分布模式、已知时空关系或常见时空过程的少数要素实体或稀有事件。
时空异常类型:
- 时空位置离群异常
- 时空属性异常
- 基于观测背景信息的异常
方法流程:
时空邻域构建
以欧氏空间、拓扑空间、网络空间等构建资源要素间的邻近依赖关系
交互作用建模
利用趋势建模、聚类分析、关联挖掘、插值预测等方法建模资源要素间的期望时空关系
时空异常度计算与异常判别
基于角度、距离、密度等方法度量时空离群程度,通过设置阈值或统计检验提取异常要素
2.2.4 时空预测建模
时空预测建模通过构建地理变量间的时空依赖关系以逼近真实地理演化过程,实现地理要素未来时空位置、属性状态的定量推演。
预测方法类型:
- 物理过程驱动的方法(地理元胞自动机、水文模型等)
- 先验信息驱动的方法(地理加权回归、时空克里金等)
- 大数据驱动的方法(深度学习网络等)
方法流程:
时空依赖关系构建
基于物理规则、先验知识或数据驱动的方式构建资源要素的时空依赖关系
模型训练与参数优化
利用历史观测数据训练模型,优化模型参数以提高预测精度
预测结果评估与应用
评估预测结果的准确性和可靠性,应用于资源管理和决策支持
2.2.5 地理风险评估
地理风险评估旨在识别、分析和评价自然资源开发利用过程中可能面临的风险,为风险防控和资源管理决策提供科学依据。
风险评估方法:
- 基于指标体系的风险评估方法
- 基于时空模型的风险情景模拟方法
- 基于多源数据融合的综合风险评估方法
方法流程:
风险识别与指标构建
识别潜在风险因素,构建风险评估指标体系
风险分析与量化
分析风险发生的可能性和影响程度,量化风险等级
风险评价与决策支持
综合评价风险状况,提出风险防控策略和决策建议
这五类自然资源时空数据挖掘方法各有侧重,相互补充,共同构成了一个全面的自然资源时空大数据挖掘方法体系。通过这些方法,可以从不同角度挖掘自然资源时空大数据中蕴含的丰富知识,为自然资源管理和国土空间决策提供科学支撑。
3 自然资源时空知识服务体系
自然资源时空知识服务是将时空大数据挖掘获取的知识成果转化为可用于决策支持的服务能力,实现从"数据"到"智慧"的跨越。基于自然资源管理的实际需求和知识应用的深度,可将自然资源时空知识服务体系分为四个层次:描述型、诊断型、预测型和决策型知识服务。

图3 自然资源时空知识服务体系
描述型知识服务
描述型知识服务主要回答"发生了什么"的问题,通过对自然资源时空大数据的整合、分析和可视化,呈现自然资源的时空分布状态、变化趋势和基本特征。
资源要素分布图谱
资源变化监测报告
资源现状统计分析
资源要素时空可视化
诊断型知识服务
诊断型知识服务主要回答"为什么发生"的问题,通过对自然资源时空大数据的深度挖掘,揭示资源变化的原因、资源要素间的关联关系以及异常现象的成因。
资源变化因素分析
资源要素关联网络
资源异常现象诊断
资源利用效率评估
预测型知识服务
预测型知识服务主要回答"将会发生什么"的问题,通过构建时空预测模型,预测自然资源的未来变化趋势、潜在风险和可能的发展情景。
资源变化趋势预测
资源风险预警
资源利用情景模拟
资源承载力预测
决策型知识服务
决策型知识服务主要回答"应该怎么做"的问题,通过整合多源知识和多种方法,为自然资源管理和国土空间规划提供优化方案和决策建议。
资源优化配置方案
国土空间规划建议
资源风险防控策略
资源政策制定支持
3.1 自然资源时空知识服务应用案例
资源现状监测与评价
基于时空聚类分析和关联挖掘方法,构建自然资源要素分布图谱和变化监测系统,实现对土地、矿产、森林等资源的动态监测和评价。
应用价值:支持资源确权登记、资源资产核算和资源保护利用决策。
国土空间规划与用途管制
基于时空预测建模和地理风险评估方法,构建国土空间适宜性评价和规划方案优化系统,支持科学合理的国土空间规划和用途管制。
应用价值:优化国土空间布局,提高土地资源利用效率,促进区域协调发展。
资源风险预警与防灾减灾
基于时空异常探测和风险评估方法,构建资源开发利用风险预警和灾害防控系统,实现对地质灾害、水土流失等风险的早期识别和预警。
应用价值:减少资源开发利用过程中的风险损失,保障人民生命财产安全。
生态修复与资源保护
基于时空关联挖掘和预测建模方法,构建生态系统健康评估和修复方案优化系统,支持退化生态系统的科学修复和资源保护。
应用价值:促进生态系统恢复,提高资源可持续利用能力,改善生态环境质量。
这些应用案例展示了自然资源时空知识服务在实际工作中的价值和潜力。通过将时空大数据挖掘方法与自然资源管理需求相结合,构建层次化的知识服务体系,可以有效支撑自然资源的科学管理和国土空间的优化利用。
4 总结与展望
本文从地理信息科学视角,系统梳理了自然资源时空大数据挖掘方法体系,阐述了5类时空数据挖掘方法及其在自然资源管理中的应用,提出了描述型、诊断型、预测型和决策型四层次自然资源时空知识服务体系。研究表明,自然资源管理正从数据汇聚分析迈向以知识为核心的智能化服务,逐渐形成大数据-大分析-大知识-大服务的研究与应用范式。
未来,自然资源时空大数据挖掘与知识服务研究将面临以下几个方向的挑战和机遇:
数据与知识协同驱动的挖掘方法
未来研究需要探索如何将领域知识与数据驱动方法有机结合,开发更具解释性和适应性的自然资源时空数据挖掘方法,实现从"数据驱动"到"知识与数据协同驱动"的方法论转变。
时空知识库与知识服务标准化
需要解决自然资源时空知识表达、存储、共享和服务的标准化问题,构建统一的自然资源时空知识库和知识服务框架,促进知识的跨部门、跨领域流通与应用。
生成式大模型在自然资源领域的应用
探索生成式AI大模型在自然资源领域的应用潜力,研究如何将自然资源专业知识融入大模型,开发具有自然资源领域专业能力的智能服务系统。
多源异构数据融合与知识发现
加强对多源异构自然资源数据的融合处理和知识发现研究,解决数据异质性、不确定性和不完整性等问题,提高知识发现的准确性和可靠性。
总之,自然资源时空大数据挖掘与知识服务是一个充满挑战和机遇的研究领域。通过不断创新方法、完善体系、拓展应用,可以为自然资源的科学管理和可持续利用提供强有力的支撑,为国家生态文明建设和高质量发展贡献力量。