融合遥感影像纹理特征和环境因子的考古遗址多模型预测及比较

Multi-Model Prediction and Comparison of Archaeological Sites by Integrating Remote Sensing Image Texture Features and Environmental Factors

研究背景与核心挑战

历史文化遗址作为人类文明与自然环境互动的物质见证,记录了特定历史时期的社会文化变迁。 然而,随着城镇化进程的加快, 考古遗址正面临土地开发与环境破坏的双重威胁。

传统的考古调查与发掘方法费时费力且效率有限,难以满足日益迫切的遗址保护与探测需求。 因此,开发高效、准确的考古遗址预测方法对于文化遗产保护和考古学研究具有重要意义。

技术挑战

  • 过分依赖宏观地形因素
  • 忽视地表纹理等微观特征
  • 复杂地形区域预测精度有限
  • 缺乏不同概率区系统评估

创新方案

  • 融合遥感影像纹理特征
  • 整合多源环境因子数据
  • 构建多模型预测框架
  • 系统评估不同概率区性能

研究价值

  • 提升考古预测精度与效率
  • 为文化遗产保护提供依据
  • 指导预防性考古工作
  • 支撑城市规划决策

多源数据融合与方法框架

多源数据整合

遥感数据源

ASTER GDEM 30m分辨率数字高程模型
Sentinel-2 多光谱影像数据(2015-2024)
Sentinel-1 SAR合成孔径雷达数据
OSM OpenStreetMap水系数据

考古遗址数据

数据来源 《中国文物地图集:陕西分册》
遗址数量 860处
时间跨度 约3000年
历史时期 新石器-隋唐

特征提取体系

环境因子 (12项)

高程
坡度
坡向
地表起伏度
平面曲率
剖面曲率
离水距
NDVI

纹理特征 (9类GLCM)

均值
方差
同质度
对比度
非相似性
角二阶矩
相关性

频率比模型 (FR)

基于条件概率的双变量统计方法,定量评估各环境因素对遗址分布的影响强度。

核心特点

  • • 简单直观的数学原理
  • • 结果具有高度可解释性
  • • 不依赖复杂参数调整
  • • 揭示古人选址偏好
FR = (Npix(Si,j)/ΣNpix(Si,j)) / (Npix(Ni,j)/ΣNpix(Ni,j))

最大熵模型 (MaxEnt)

基于最大熵原理的机器学习模型,专为仅有存在数据设计,适合考古遗址预测。

技术优势

  • • 处理presence-only数据
  • • 捕捉复杂非线性关系
  • • 小样本情况下稳定
  • • 精确定位高价值区域
P* = arg max H(P)
最大熵分布

随机森林模型 (RF)

基于集成学习的机器学习算法,具有处理高维数据的卓越能力,适合多特征融合。

算法特色

  • • 处理高维数据能力强
  • • 内置特征重要性评估
  • • 对异常值不敏感
  • • 大范围高效率识别
F(x) = mode{f₁(x), f₂(x), ..., fₙ(x)}
集成预测

实验结果与性能对比分析

核心研究发现

随机森林最优

纹理特征利用最充分,AUC从0.85提升至0.86,在大范围区域实现高效识别

MaxEnt精准定位

在极小面积区域(0.1%)内实现极高增益值(0.90),精确定位核心遗址区

纹理特征有效

融合遥感纹理特征是提升考古预测精度的有效路径,但需选择合适模型

AUC精度对比

传统环境因子 基线性能
随机森林 (RF) 0.85 → 0.86
最大熵 (MaxEnt) 无显著变化
频率比 (FR) 无显著变化

空间预测效能

随机森林覆盖率 92.56% (44.53%面积)
MaxEnt精准度 0.90增益 (0.1%面积)
频率比识别率 仅7.79%
RF增益提升 0.59 → 0.67

模型适用性与应用场景

随机森林 - 大范围普查
  • • 适合大范围考古普查规划
  • • 高效率遗址识别能力
  • • 在较大区域内覆盖率高
  • • 纹理特征利用充分
MaxEnt - 精准定位
  • • 精确定位小范围核心区
  • • 极高准确性预测能力
  • • 适合重点遗址区识别
  • • 资源集中投入指导
频率比 - 基础分析
  • • 揭示古人选址偏好
  • • 结果易于理解解释
  • • 判别能力相对有限
  • • 适合初步规律分析

西安市案例研究与实践验证

研究区域特征

地理位置 107°40′E-109°49′E, 33°42′N-34°45′N

地形特征 北部渭河平原,南部秦岭北麓

海拔范围 400-1200米梯度分布

气候类型 暖温带半湿润季风型

历史文化价值

建城历史 3100多年

国都历史 1100多年

建都朝代 14个朝代

丝路起点 欧亚贸易路线网络发源地

遗址分布特征

空间分布

集中分布于渭河平原和台地区域,呈现显著空间异质性

类型多样

包括宫殿、墓葬、城址、寺庙和民居等不同类型遗址

重要遗址

秦始皇陵为代表的大型陵墓群及周边地面地下遗址

保护挑战

快速城镇化发展压力
地铁道路等重大工程建设
建设与文保冲突频发
亟需预防性考古指导

研究成果的实践应用价值

考古普查

指导大范围考古调查规划

预防保护

减少建设与文保冲突

城市规划

为城市发展提供科学依据

学术研究

推进考古预测方法创新

技术创新与学术贡献

方法学创新

  • 多源数据融合: 首次系统整合遥感纹理特征与传统环境因子
  • GLCM纹理提取: 基于灰度共生矩阵提取9类微观地表特征
  • 多模型对比: 构建FR-MaxEnt-RF三模型评估框架
  • 分区评估: 系统评估不同概率区间预测能力

性能提升

随机森林AUC提升 0.85 → 0.86
高概率区增益提升 0.59 → 0.67
遗址识别覆盖率 92.56%

学术贡献

  • 理论突破: 证实遥感纹理特征对考古预测的有效性
  • 方法体系: 建立多模型评估与选择的科学框架
  • 实践指导: 为不同考古目标提供针对性方法选择
  • 应用示范: 在西安地区的成功应用验证了方法可行性

未来展望

技术拓展

结合深度学习、LiDAR等新技术进一步提升精度

区域推广

在更多历史文化区域验证和推广应用

标准建立

建立考古预测模型评估与选择的行业标准

遥感技术赋能考古遗址智能预测

本研究通过融合遥感影像纹理特征与传统环境因子,构建了多模型考古遗址预测框架, 为文化遗产的预防性保护提供了科学依据,推动了考古预测技术的创新发展

多源遥感数据融合

整合ASTER GDEM、Sentinel-2、Sentinel-1 SAR等多源遥感数据, 提取12项环境因子和9类GLCM纹理特征。

技术优势

  • • 全天候全天时观测能力
  • • 对地表微观结构高灵敏度
  • • 大范围高效数据获取
21维特征
环境因子+纹理特征

智能预测模型集成

构建频率比、最大熵、随机森林三种预测模型, 系统评估不同算法在考古预测中的适用性。

模型特色

  • • FR:简单直观,易于解释
  • • MaxEnt:精准定位,小区域高效
  • • RF:大范围识别,特征融合强
3模型框架
统计学+机器学习

文化遗产预防保护

为城市建设与文化遗产保护提供科学决策支持, 减少开发建设与文物保护之间的冲突。

应用价值

  • • 指导考古普查规划
  • • 支撑城市发展决策
  • • 实现预防性保护
860处遗址
西安地区验证

核心研究成果与创新突破

量化成果指标

随机森林AUC提升 +0.01 (0.85→0.86)
高概率区增益提升 +0.08 (0.59→0.67)
遗址识别覆盖率 92.56%
MaxEnt精准增益 0.90 (0.1%面积)

创新贡献总结

方法创新

首次系统融合遥感纹理特征与环境因子

技术突破

证实纹理特征对考古预测的有效性

应用示范

在西安地区成功验证方法可行性

实践指导

为不同考古目标提供科学方法选择

三种预测模型性能对比

基础分析
频率比 (FR)
7.79%识别率
适合初步规律分析
精准定位
最大熵 (MaxEnt)
0.90增益值
小范围高准确性
最优综合
随机森林 (RF)
AUC: 0.86
大范围高效识别