摘要
【目的】基于合成孔径雷达(SAR)影像的舰船检测已广泛用于海洋搜救、港口侦察、领海防御等领域。然而,随着在轨智能处理技术的快速发展,对星载SAR影像舰船目标的实时检测能力提出了更高的要求。
【方法】因此针对当前SAR影像舰船目标尺度多样,靠岸船只背景复杂,各类遥感平台硬件资源受限等问题,本文提出了一种轻量级SAR影像舰船检测模型LWM-YOLO。首先,采用优化骨干网络结合注意力机制降低网络复杂度及参数量,提出一个轻量化骨干网络(LWCA);其次,针对解决目标尺度多样问题,构建了一个轻型特征融合模块(LGS-FPN),在增强SAR影像中舰船目标细节信息提取能力的同时减少计算复杂度;然后,为优化定位精度,提出基于MPD-Head的检测架构,提升复杂环境中微小舰船目标的检测效果;最后,在LS-SSDD和SSDD舰船目标检测数据集上,将本文算法与主流算法进行对比实验。
【结果】实验结果表明,本文提出的算法平均精度值(mAP)分别达到了74.7%和97.3%,较基础模型提升了1.5%和1.0%。同时,本文所提算法参数规模缩减至原模型的36%,计算复杂度降至80%。
【结论】与其他方法相比,本文提出的算法不仅在精度上有所提升,而且在检测速率上也具有显著优势。这一研究成果可为智能化目标检测、空间在轨应用等领域提供有力支撑。
引言
随着遥感技术的快速发展,合成孔径雷达(Synthetic Aperture Radar, SAR)成像技术被广泛应用于环境监测、沉船救援、漏油检测、海上舰船控制等方面。其中,目标检测算法能自动对SAR影像中的舰船目标定位与分类,从而在舰船目标检测中扮演着至关重要的角色。然而,传统的舰船目标检测算法大多针对特定场景,检测过程高度依赖于预先定义的分布或人工设计的特征,致使算法的鲁棒性较低,泛化性差。
近年来,深度学习技术以其强大的特征提取能力,在目标检测领域取得了显著进展。根据是否需要预选框,可以将这些算法分为两大类:一类是两阶段目标检测算法,该算法先生成目标预选框,对待检测目标进行定位,再进行样本分类,这类算法主要包括Faster R-CNN、R-CNN、Mask R-CNN等。但因其计算复杂度较高、效率较低致使其不满足舰船目标检测的实时性需求。另一类则是一阶段目标检测算法,该算法省去生成目标预选框的步骤,直接通过回归方式预测目标位置和类别,从而在保持较高检测精度的同时,显著提升了检测效率,其代表算法有SSD和YOLO系列算法等。
SAR影像舰船检测面临的挑战
小目标检测困难
相较于光学影像,SAR影像中的小型舰船在广阔的海域背景中缺乏显著的纹理和形状特征,使得传统的基于特征的检测方法难以有效区分。
复杂背景干扰
SAR影像不仅包含海洋表面,还可能包含陆地、岛屿等多种地形地貌,这些复杂多变的背景信息往往与目标舰船产生混淆。
模型部署困难
传统检测模型因追求精度,导致模型参数量大,部署困难。实现高性能模型的轻量化和易部署性显得至关重要。
相关研究进展
精度提升研究
陈丁等提出将CNN和HRBM相结合的方法,苏娟等通过迁移学习和浅层特征增强改进SSD算法,贾晓雅等提出基于YOLO框架的无锚框方法,高鹏飞等融合多元稀疏特征提取模块和阶层深度特征融合模块。
复杂环境适应性研究
杨金鹏等通过替换金字塔模块、引入注意力机制改进YOLOv5,薛远亮等提出基于融合注意力机制与改进的SSD算法,Chen等提出集成注意力机制的舰船检测网络。
轻量化研究
李健伟等以SSD算法为基础提出快速SAR图像目标检测算法,Zhang等提出深度方向可分离卷积神经网络(DS-CNN),Mao等通过融合简化的U-Net和无锚探测框架提出轻型SAR舰船探测器。
本文研究内容
基于上述研究分析,为检测复杂背景下的大场景SAR影像小尺寸舰船目标,本文提出了一种轻量化的算法LWM-YOLO。该算法通过以下三项核心创新:
- 通过优化骨干网络结构,提出了LWCA骨干网络,成功降低了模型的参数量和计算复杂度。
- 创新特征融合方式,提出了LGS-FPN特征融合策略,进一步减少了模型的存储空间占用并提升了对小目标的检测精度。
- 为有效捕捉微小舰船目标的位置变化,设计了基于MPD-Head的检测架构。
研究方法
技术路线
本文以YOLOv8为基准模型,提出的LWM-YOLO算法系统架构如下图所示:

图1 LWM-YOLO的整体框架
LWM-YOLO算法包含三个关键组件:LWCA骨干网络、LGS-FPN特征融合策略和基于MPD-Head的检测架构。这三个组件协同工作,共同实现了高效、精准的舰船目标检测。
LWCA骨干网络
为解决SAR影像技术在移动作业平台上的应用挑战,本文提出了LWCA骨干网络,旨在以极低的计算复杂度实现高精度的目标检测任务。
轻量化骨干网络
通过对基础骨干网络的重构与优化,实现了对背景区域无效特征提取的有效抑制,显著降低了模型的计算复杂度。具体包括:
- 识别并剔除信息损失严重的卷积层(第7层和第8层)
- 根据各层特征的重要性和关联性,优化通道数配置
- 引入正则化项抑制过拟合,使用学习率衰减策略稳定训练
注意力机制模块
引入坐标注意力机制模块(Coordinate Attention, CA),有效弱化背景噪声,突出舰船目标特征。CA注意力模块包括:
- 坐标信息嵌入:沿X方向与Y方向分别应用平均池化技术
- 注意力生成:通过卷积层、批归一化和非线性激活函数处理
- 特征重标定:将生成的权重应用于原始特征图

图2 LWCA结构
LGS-FPN特征融合策略
针对大场景SAR影像中小尺寸舰船目标检测的挑战,本文提出了LGS-FPN(Localized and Global-aware Selective Feature Pyramid Network)特征融合策略,旨在使用更为高效的空间与语义特征集成方法。

图3 LGS-FPN的结构
LGS模块
LGS(Localized and Global-aware Selective Feature)模块由两大互补性组件构成:
- 全局感知模块:运用全局平均池化等策略,对特征图的全局统计特性进行深入挖掘
- 局部细化模块:专注于特征图的局部细节,通过保持空间分辨率的卷积操作,捕获并强调局部上下文中的关键特征
特征融合过程
LGS-FPN的特征融合过程包括:
- 特征选择:基于全局与局部信息的综合评估,动态识别并保留最具判别力的特征
- 特征增强:将筛选后的高层特征(富含语义信息)与低层特征(保留空间细节)进行协同集成
- 特征整合:生成既包含深层语义理解又保留精细空间结构的复合特征表示
基于MPD-Head的检测架构
为进一步提升检测精度,特别是针对复杂背景下的微小舰船目标,本文提出了基于MPD-Head的检测架构。该架构通过并行处理的分类与回归分支,结合高效的特征降维与深度卷积技术,显著提升了复杂环境中微小舰船目标的检测效果。

图4 MPD-Head的结构
MPD-Head的核心设计包括:
- 使用紧凑的1×1卷积降低通道维度,优化后续处理的数据规模与计算效率
- 并行展开为分类分支与回归分支,通过堆叠卷积层提取和增强特征表达能力
- 在回归分支中引入MPDIoU(Mean Partial Distance Intersection over Union),通过计算预测与真实边界框关键点的Partial Distance,全面评估边界框间的相似性与差异
MPDIoU的计算过程包括三个步骤:
- 计算两边界框之间的IoU值
- 计算两个框的PD值(关键点间的距离)
- 用IoU值减去PD值除以对角线平方的值,得到MPDIoU值
实验结果与分析
实验数据及环境
数据集
本实验采用两个数据集:
- LS-SSDD数据集:大场景小目标SAR舰船检测数据集,源于15幅高分辨率、宽覆盖范围的原始星载SAR图像,切片形成9000个800×800像素的图像
- SSDD数据集:收录1160幅图像,涵盖2456个舰船实例,平均每幅图像包含约2.12个舰船目标
实验环境
操作系统 | Ubuntu22.04 |
GPU | Geforce RTX 2060Ti 6G |
CPU | AMD Ryzen 7 3700X |
内存 | 16G |
深度学习框架 | Pytorch12.0 |
Python版本 | 3.8 |
GPU加速平台 | CUDA11.4 |
LWM-YOLO的性能评估
对比实验
为全面验证本文所提出算法相较于其他先进算法的优越性,进行了一系列对比实验:
数据集 | 网络模型 | 精确率 | 召回率 | mAP | FLOPs/G | 参数量/M | FPS/(帧/s) |
---|---|---|---|---|---|---|---|
LS-SSDD | FreeAnchor | 0.553 | 0.777 | 0.710 | 127.82 | 36.33 | 11.47 |
DCN | 0.741 | 0.769 | 0.738 | 116.82 | 41.93 | 10.05 | |
EfficientDet | 0.621 | 0.675 | 0.614 | 107.52 | 39.40 | 11.42 | |
YOLOv8n | 0.812 | 0.660 | 0.732 | 8.10 | 3.01 | 148.32 | |
YOLOv9t | 0.853 | 0.661 | 0.741 | 7.60 | 1.97 | 120.92 | |
YOLOv10n | 0.780 | 0.616 | 0.703 | 8.20 | 2.69 | 128.25 | |
YOLOv11n | 0.825 | 0.646 | 0.729 | 6.30 | 2.58 | 138.38 | |
本文方法 | 0.837 | 0.672 | 0.747 | 6.50 | 1.07 | 152.40 | |
SSDD | PANET | 0.868 | 0.919 | 0.912 | — | — | 11.65 |
Grid R-CNN | 0.878 | 0.897 | 0.890 | — | — | 9.18 | |
YOLOv8n | 0.942 | 0.956 | 0.963 | 8.10 | 3.01 | 691.51 | |
YOLOv9t | 0.959 | 0.916 | 0.969 | 7.60 | 1.97 | 707.03 | |
YOLOv10n | 0.920 | 0.964 | 0.960 | 8.20 | 2.69 | 757.44 | |
YOLOv11n | 0.961 | 0.964 | 0.970 | 6.30 | 2.58 | 725.33 | |
本文方法 | 0.941 | 0.965 | 0.973 | 6.50 | 1.07 | 729.90 |
从表中可以看出,本文算法在LS-SSDD数据集上的mAP达到了0.747,在SSDD数据集上的mAP达到了0.973,分别较基础模型提升了1.5%和1.0%。同时,本文算法的参数量仅为1.07M,计算复杂度为6.50G,帧率分别达到了152.40帧/秒和729.90帧/秒,展现了优异的轻量化性能。
消融实验
为验证本文所提方法的有效性,在LS-SSDD数据集上进行了消融实验:
网络模型 | 精确率 | 召回率 | mAP | FLOPs/G | 参数量/M | FPS/(帧/s) |
---|---|---|---|---|---|---|
YOLOv8n | 0.812 | 0.660 | 0.732 | 8.1 | 3.01 | 148.32 |
YOLOv8n-M | 0.833 | 0.644 | 0.729 | 8.1 | 3.01 | 146.92 |
YOLOv8n-LGS | 0.823 | 0.669 | 0.743 | 7.1 | 2.03 | 149.23 |
YOLOv8n-L | 0.824 | 0.654 | 0.727 | 7.5 | 2.23 | 152.28 |
YOLOv8n-L-LGS | 0.819 | 0.667 | 0.738 | 6.5 | 1.07 | 152.81 |
YOLOv8n-L-LGS-M | 0.837 | 0.672 | 0.747 | 6.5 | 1.07 | 152.40 |
从消融实验结果可以看出,LWCA骨干网络(L)有效提升了计算效率,但检测精度略有下降;LGS-FPN特征融合策略(LGS)显著增强了模型的检测性能;MPD-Head检测架构(M)进一步提升了目标检测精度。三者结合形成的完整LWM-YOLO算法(YOLOv8n-L-LGS-M)在精度和效率方面都取得了最佳表现。
LGS-FPN有效性实验
网络模型 | 精确率 | 召回率 | mAP | FLOPs/G | 参数量/M | FPS/(帧/s) |
---|---|---|---|---|---|---|
YOLOv8n-PAFPN | 0.812 | 0.66 | 0.732 | 8.1 | 3.01 | 148.32 |
YOLOv8n-HSFPN | 0.813 | 0.649 | 0.728 | 6.9 | 1.93 | 148.07 |
YOLOv8n-LGSFPN | 0.823 | 0.669 | 0.743 | 7.1 | 2.03 | 149.23 |
实验结果表明,LGS-FPN特征融合网络相较于传统的PAFPN和先进的HS-FPN,展现出了更高的检测精度。LGS-FPN不仅显著降低了运算的复杂度与模型参数量,使之低于PAFPN,还实现了帧率的提升,从而在保证检测精度的同时,大幅度优化了模型的运行效率与资源占用。
讨论
本文提出了一种轻量级的SAR影像舰船检测算法,该算法在复杂环境下的SAR影像中展现出了对舰船目标的精准识别,实现了提高精度和压缩模型的有效结合。实验结果表明,本文提出的算法在两个数据集上均取得了优异的表现,并且在处理不同场景和不同尺度目标的检测任务时,也展现出了较高的准确性。
尽管本文算法在实验中取得了显著成效,但从精确率和召回率等评估指标来看,其性能仍有进一步提升的空间。在下一步研究工作中,可以考虑以下几个方向:
- 加强对网络架构进行优化设计
- 引入不同场景的SAR数据集,提高模型的泛化能力
- 探索将图像增强技术和斜框检测策略融入到SAR图像舰船目标检测中
结论
针对大场景SAR影像中舰船目标检测面临的高精度挑战及漏检、误检等问题,本文提出了一种深度优化的轻量化检测算法LWM-YOLO。该算法通过3项核心技术创新——LWCA骨干网络、LGS-FPN特征融合策略、以及基于MPD-Head的检测架构,并与EfficientDet、YOLOv9、YOLOv10等网络进行对比。相较于基准模型,本文提出的算法参数量降低为原来的36%,运算复杂度降低为原来80%,mAP提高1.5%,证明了本文方法能够在保持低资源消耗的前提下,实现对舰船目标的精确、快速检测。
通过实验对比,可以得出以下结论:
LWCA骨干网络
通过重构卷积层架构和优化通道配置策略,实现了模型体量精简和特征表达能力提升。融入的CA注意力模块不仅提升了检测效率还增强了模型对关键特征的捕捉能力。
LGS-FPN特征融合策略
通过引入局部与全局信息增强的策略,有效提升了特征金字塔中不同尺度信息的融合效率与丰富性,同时降低了网络的整体运算复杂度。
MPD-Head检测架构
通过优化舰船目标边界框的定位精度,有效增强了目标检测的准确性。实验证明,该架构在复杂背景下对小目标的检测能力具有显著提升。
本文提出的LWM-YOLO算法在保持高检测精度的同时实现了模型的轻量化,为复杂场景下的舰船目标检测提供了一种高效可行的解决方案,对于推进SAR影像舰船目标检测技术的发展具有重要意义。
* 以上内容由AI自动生成,内容仅供参考。对于因使用本网站以上内容产生的相关后果,本网站不承担任何商业和法律责任。