研究意义与核心概念
跨视角图像地理定位是指将带有坐标元数据的卫星图像作为参考图像, 从而确定待查询的地面视角图像地理坐标的过程。 由于卫星图像可以做到全球覆盖且获取便捷,将其作为参考影像进行图像定位 极大地扩展了图像地理定位的应用范围。
自动驾驶
核心定位技术
户外机器人
导航定位支撑
军事应用
目标识别定位
智慧城市
空间信息服务
技术挑战与难点
视角差异巨大
地面(侧视)图像和卫星(俯视)图像之间 将近90度的视角差异, 导致视觉内容差异巨大、相似性很小。
时间差异影响
- • 光照条件变化
- • 季节变化影响
- • 获取时间不同
场景相似性问题
- • 纹理相似性极高
- • 检索信息重复度高
- • 城市建筑相似特征
动态干扰因素
- • 汽车、行人等瞬态物体
- • 非固定目标干扰
- • 场景变化影响
定位精度层级演进
图像级定位
定位方法
通过对小面片卫星图像集检索,将检索到的卫星面片内的 中心像素对应的GPS坐标 作为地面图像位置
精度限制
地面图像不一定对应卫星图像的中心位置, 只能提供粗略近似
像素级定位
精确定位
在大幅面卫星图像上进行更精准的地理定位, 确定地面图像中心位置对应的卫星图像中的 具体像素
细粒度定位
识别卫星补丁中的哪些图像坐标对应于 地面测量的位置
研究发展历程
文献统计概况
总文献数量
英文124篇,中文5篇
研究时间跨度
13年发展历程
快速发展起点
深度学习推动
阶段一:手工特征提取(2011-2017)
技术特点
- • 依赖手工制作的特征提取器
- • 主要基于建筑物几何特征
- • 针对城市区域定位
发展特征
- • 起步阶段,发展缓慢
- • 应用场景有限
- • 精度受限
阶段二:深度学习图像级定位(2017-2020)
技术突破
- • 深度度量学习技术应用
- • 深度特征提取替代手工特征
- • 检索精度达到90%以上
应用扩展
- • 适用于更丰富场景
- • 郊区和城市区域
- • 全球范围定位可能
阶段三:深度学习像素级定位(2020至今)
精度提升
- • 细粒度度量定位
- • 像素级精确定位
- • 相机位置姿态计算
研究热点
- • 2019年后研究陡增
- • 多种算法创新
- • 实用性大幅提升
方法分类与技术路线
表征学习改进
核心技术
- • 深度度量学习
- • 特征表征优化
- • 跨域特征对齐
度量计算优化
关键方法
- • 相似性度量改进
- • 距离计算优化
- • 匹配算法创新
视角转换专门技术
几何变换
- • 透视变换
- • 视角校正
- • 几何关系建模
图像生成
- • 跨视角图像转换
- • GAN生成技术
- • 视角合成
辅助信息
- • 方向信息利用
- • 无人机中间视角
- • 多模态融合
研究热点与趋势
Capsule Network
Transformer
Image Translation
Drone Vision