跨视角图像地理定位技术作为GNSS之外的第二个精确位置信息来源,在无人机导航、目标定位等现实任务中发挥重要作用。然而,现有方法面临高质量标注样本稀缺和空间布局特征建模缺失的挑战。
图1 DINO-MSRA网络架构
基于DINOv2大模型,通过Conv-LoRA微调策略实现参数高效的特征提取,仅需19.2%的参数量即可达到优异性能。
基于Mamba模块设计的空间关系感知特征聚合器,有效捕捉特征间的几何空间配置信息。
采用InfoNCE损失函数,充分利用批次内所有负样本,提升模型泛化性和整体性能。
任务类型 | R@1精度 | AP精度 | 相比CAMP提升 |
---|---|---|---|
无人机定位 (无人机→卫星) | 95.14% | 95.92% | +0.68% |
无人机导航 (卫星→无人机) | 97.29% | 93.81% | +1.14% |
图2 Dinov2-CL架构
图3 基于Mamba的空间关系感知特征聚合器
图4 各算法在SUES-200数据集上的对比实验
图5 检索结果可视化
大部分查询影像都可以在Top1检索到正确影像
所有查询影像都可以在Top5检索到正确影像
在不同飞行高度下均能提供稳健的检索定位能力
* 以上内容由AI自动生成,内容仅供参考。对于因使用本网站以上内容产生的相关后果,本网站不承担任何商业和法律责任。