自适应膨胀和结构嵌入的非对称哈希遥感图像检索算法

研究摘要

研究背景

随着遥感平台日新月异,遥感图像数量呈指数级增长,如何从遥感大数据中筛选出所需遥感图像已成为遥感应用亟待解决的核心问题之一。传统基于深度卷积神经网络的方法虽然有效,但高维特征导致相似性度量困难,降低了检索速度和精度。

创新方法

本文提出了一种结合自适应膨胀卷积和结构嵌入网络的非对称哈希遥感图像检索方法(DSAH):

  • 自适应膨胀卷积模块:不增加额外参数同时自适应捕捉多尺度特征
  • 优化结构嵌入模块:有效提取遥感图像中的几何结构特征
  • 成对相似性约束:保留原始特征空间中的相似性到哈希空间

研究成果

在UCM、NWPU、AID和PatternNet四个数据集上的64-bit哈希码平均查准率(mAP)分别达到:

UCM数据集

98.07%

NWPU数据集

93.65%

AID数据集

97.92%

PatternNet数据集

97.53%

实验结果表明,本文方法优于现有的深度哈希图像检索方法,显著提高了遥感图像检索的准确性和效率。

实验数据集

UCM数据集

21类×100幅

加州大学提出的遥感场景识别数据集,256×256像素,空间分辨率0.3m

NWPU数据集

45类×700幅

西北工业大学设计的大规模分类数据集,256×256像素,考虑多种影响因素

AID数据集

30类×220-420幅

华中科大和武大联合提出,600×600像素,分辨率0.5-0.8m,类内差异大

PatternNet

38类×800幅

武汉大学提出的大规模高分辨率数据集,256×256像素,目标集中背景干扰小

方法概述

DSAH网络模型框架

图1 DSAH网络模型框架

自适应膨胀卷积模块

设计金字塔膨胀卷积(膨胀率1,2,3)和特征自适应模块,在不增加参数的情况下捕捉多尺度特征。

结构嵌入网络模块

优化改进结构嵌入模块,包含自相似性计算、编码和特征融合三个子模块,有效提取几何结构特征。

损失函数设计

联合损失函数包含:

  • 非对称成对损失 ℒₛ
  • 语义损失 ℒₛₑₘ
  • 成对相似性约束 ℒₚₐᵢᵣ
ℒₜₒₜₐₗ = λℒₛ + εℒₛₑₘ + ηℒₚₐᵢᵣ

实验结果

消融实验

表1 不同网络框架下的检索评价指标

方法 mAP ANMMR
ResNet18 0.6890 0.260
+结构自相似性编码 0.8171 +12.81% 0.150 -11%
+自适应膨胀卷积 0.9224 +10.53% 0.061 -8.9%
+成对相似性约束(DSAH) 0.9807 +5.83% 0.009 -5.2%

对比实验

表2 AID数据集上的训练时间和检索时间对比

方法 训练时间(s) 检索时间(s)
DSAH(本文) 704.11 16.92
AHCL 715.48 17.15
ADSH 743.82 17.05
FAH 780.48 90.29
DPSH 708.54 86.85
DHN 706.78 76.32

研究结论

主要贡献

  • 自适应膨胀卷积模块:不增加额外参数情况下捕捉多尺度特征,在UCM数据集上mAP指标提高10.53%
  • 结构嵌入网络:增强几何结构特征表达,使mAP指标提升12.81%
  • 成对相似性约束:保留哈希空间相似性,mAP指标提升5.83%

未来展望

虽然DSAH算法获得了更好的检索效果,但仍存在改进空间:

  • 增强模型泛化能力以适应更多复杂变化场景
  • 探索自适应调整模型的方法
  • 寻找更精确的相似性度量方法