研究背景

水资源在自然界中扮演着重要的角色,对生态平衡的维持、气候的调节和人类的生产生活等方面具有不可替代的作用与影响。快速有效地获取水体信息对于最大限度地发挥水资源的积极作用,同时减少其负面影响具有重要意义。

遥感技术优势

遥感技术因监测范围广、实时性高、成本低等优势,已经成为水域变化监测和水体信息提取的主要实现手段。

传统方法局限

传统方法如阈值法和分类器法虽然在一定程度上提高了遥感图像水体提取的性能,但仍存在处理微小水体和含有杂质的水体时表现较差、依赖人工设计特征等问题。

研究创新点

本文设计了一种融合空间和通道注意力的注意力模块(HAM),将其嵌入HarDNet-MSEG产生一种变体模型,旨在自动准确地从复杂场景的遥感影像中提取水体信息。

研究方法

网络框架

本文用到的网络框架为HarDNet-MSEG,这是一种用于医学影像息肉分割的网络。网络的编码器部分由HarDNet68以及几个常用的卷积和池化层组成。

HarDNet以其独特的谐波块结构和稠密连接方式,在低内存流量的前提下实现了高效的特征提取和模型训练。在利用HardBlock提取特征后,使用1×1卷积降低特征图的通道数,最后使用最大池化减少特征图尺寸。

混合注意力机制(HAM)

遥感影像幅宽大,波段多,场景内容复杂,其包含的空间信息和通道信息对于地物的识别具有重要作用。在图像处理中,注意力机制可以使模型在处理图像时关注于图像中的特定区域,以更好地捕捉图像中的相关信息,提高模型性能和泛化能力。

HAM模块对特征图按通道数均匀分割成两半,分别进入通道注意力和空间注意力模块。通道注意力部分沿用了SE模块的整体设计,空间注意力部分使用了CBAM中的SAM模块。

混合注意力机制(HAM)

改进的HarDNet-MSEG

注意力机制一般适用于通道与空间都比较适中的网络中间层。考虑到特征通道中存储的信息较空间位置更具主导作用,同时深层信息又能够有效地保留浅层信息的空间细节,本文将所设计的HAM插入到网络中的不同位置,分别标记为HAM1、HAM2、HAM3,以确保注意力模块能够有效地提取特征。

HAM在网络中的不同位置

实验与分析

实验区概况

青藏高原位于中国西南部(26°00'12′′N—39°46'50′′ N,73°18'52′′E—104°46'59′′ E)。其水资源十分丰富,是亚洲许多大江大河的发源地,也是亚洲的冰川、湖泊、湿地聚集地,素有"亚洲水塔"之称。高原平均海拔大于4000m,是中国最大、世界平均海拔最高的高原。

青藏高原研究区概况

数据集

以青藏高原为研究区,所使用的Landsat数据包括Landsat8和Landsat9,共计获取了145景影像。所有数据已经过预处理,并进行了数据标注、样本切分及数据增强。

数据预处理步骤:

  • 基于水体指数与人工修正的方法绘制湖泊边界数据
  • 将矢量数据转为栅格数据,完成标签的制作
  • 按照尺寸为512像元×512像元进行滑动切分
  • 对样本进行筛选,删除无效样本
  • 进行随机旋转、镜像等手段的数据增强

数据集划分:

训练集 60%
验证集 20%
测试集 20%

实验设计

研究工作包括以下6个方面:

  1. 消融实验:探究在HarDNet-MSEG网络中合适的位置来放置HAM模块
  2. 与其他注意力模块对比分析:将提出的HAM模块与经典的SE模块和CBAM模块进行对比分析
  3. 与其他经典的分割算法对比分析:验证其在水体提取任务上的优越性
  4. 与传统方法进行对比分析:显示其在水体提取任务中的优势
  5. 应用到其他数据集上:测试模型的通用性能
  6. 提取内流流域4个时期的湖泊:分析湖泊面积变化

实验环境:

操作系统 Windows10
CPU Intel Core i7-12700F
GPU NVIDIA RTX3060 12GB
深度学习框架 Pytorch1.13

评价指标:

像元准确率(PA) 99.32%
平均交并比(MIoU) 94.07%
频权交并比(FWIoU) 97.74%

实验结果

消融实验

通过将HAM嵌入到网络的不同位置,可以发现引入HAM模块的HarDNet-MSEG收敛速度比原始HarDNet-MSEG的收敛速度快,且引入HAM模块的HarDNet-MSEG均获得了较高的MIoU、FWIoU、PA,证明了HAM模块的有效性。

不同模型的训练结果对比
模型 MIoU(%) FWIoU(%) PA(%)
HarDNet-MSEG 92.9394 96.7248 98.3187
HarDNet-MSEG-HAM1 94.0687 97.7374 99.3205
HarDNet-MSEG-HAM2 92.9546 96.9572 98.9769
HarDNet-MSEG-HAM3 93.9841 97.3281 98.9174

与传统方法对比

与MNDWI,NDWI,单波段阈值法和SVM等传统方法的对比实验更进一步证明了HarDNet-MSEG-HAM1在区分水体与山体阴影、云及其阴影方面的优势。

不同方法的水体提取结果对比
方法 总体精度(%) Kappa系数
HarDNet-MSEG-HAM1 96.1915 0.9231
MNDWI 93.2535 0.8643
NDWI 93.0359 0.8579
单波段阈值法 92.8183 0.8554
SVM 91.8390 0.8336

与其他经典网络对比

与DeepLabV3+、U-Net和PSPNet等经典分割模型的实验证明了HarDNet-MSEG-HAM1在提取不同大小、不同形状和分布条件下的水体方面的优越性和可行性。

不同语义分割网络的训练结果
模型 MIoU(%)
HarDNet-MSEG-HAM1 94.0687
DeepLabV3+ 92.4686
U-Net 93.4298
PSPNet 92.9329
模型性能对比
模型 参数量(M)
HarDNet-MSEG-HAM1 21.00
DeepLabV3+ 45.70
U-Net 51.50
PSPNet 43.30

内流流域湖泊年际变化

利用HarDNet-MSEG-HAM1对2013、2016、2019年和2022年的9—11月Landsat影像进行湖泊提取,分析青藏高原内流流域湖泊面积变化。

4个时期内流流域的湖泊总面积
年份 本文提取结果(km²) 参考文献[50]的提取结果(km²)
2013 29478.78 32851.39
2016 33305.82 33532.78
2019 35157.80 35413.30
2022 35079.76 35258.33

结论与展望

主要结论

  • 通过将HAM嵌入到网络的不同位置,发现引入HAM模块的HarDNet-MSEG收敛速度比原始HarDNet-MSEG的收敛速度快,且获得了较高的MIoU、FWIoU、PA
  • HarDNet-MSEG-HAM1的MIoU、FWIoU、PA分别达到了94.0687%、97.7374%和99.3205%,表明将HAM模块置于HAM1处可以快速捕捉和充分利用丰富的多尺度上下文信息
  • 与传统方法和经典分割模型相比,HarDNet-MSEG-HAM1在水体分割任务中具有良好的表现性能
  • 成功提取了青藏高原内流流域2013、2016、2019和2022年的湖泊,面积变化趋势与其他研究结果一致

未来展望

  • 将HAM注意力模块成功应用到其他遥感图像分割任务中,以进一步验证其在不同领域的适用性
  • 将重点扩展到更广泛的水体监测任务,以追踪水体分布和变化的长期趋势,有助于发现水资源可持续性问题
  • 探索模型在更高分辨率遥感影像上的应用,提高对小水体的识别能力
  • 研究如何将模型部署到实际业务系统中,实现水体信息的实时监测与提取

* 以上内容由AI自动生成,内容仅供参考。对于因使用本网站以上内容产生的相关后果,本网站不承担任何商业和法律责任。