点击我爱计算机视觉标星,更快获取CVML新技术


本文原载于知乎,已获作者授权转载,请勿二次转载。

https://zhuanlan.zhihu.com/p/110987552

简介(与行人重识别的关系):

  • 随着无人机的发展,无人机视角的目标定位是一个基本的任务,透过无人机视角图像与卫星图像相结合,来判断目标建筑的位置。

  • 主要难点与行人重识别任务一致,为跨视角的图像匹配。在行人重识别任务中为跨摄像头匹配,而在无人机定位任务中为垂直方向的视角匹配(街景<-> 无人机 <-> 卫星)。

  • 行人重识别目前发展得比较好,数据集也被大家刷很高;而geo-localization这个任务才刚刚开始,匹配难度较高,做的空间还比较大。

  • 行人重识别在隐私政策上有一些考虑,采集了人体的生物信息;而无人机的建筑定位相对科研伦理/隐私上的问题比较小。

主要任务描述:

  • 任务1 - 无人机视角目标定位 (Drone-> Satellite) :给定一张无人机视角的图片或者视频,这个任务是去找最相似的卫星图,卫星图往往有gps所以就可以对无人机中的目标定位。

  • 任务2 - 无人机导航 (Satellite->Drone): 给定一张卫星视角的图,无人机尝试去找他飞过的地方(无人机视角的图)。如果找到就按照飞行历史,再飞回去,完成一个导航的操作。

数据采集:

我们利用了wiki 来找到了 72所大学的建筑名称,去除其中的广场campus,以及一些google map上找不到的地点。

下图展示了前100个building名称(en.wikipedia.org/wiki/C)

我们利用google earth去模拟无人机视角的图像,如下面这个视频,采用一个螺旋形的方式接近建筑。

同时对于每个建筑,我们还收集了卫星图,和google map的街景图。

之前的数据集往往只收集地面和卫星的image pair。我们则提供了无人机视角图像作为中间的媒介,同时无人机可以减少树木的遮挡,更容易与卫星图做匹配。(下表为training set的对比)

我们数据集的统计数据如下:(训练和测试分别是33 和 39所大学,共72所大学,没有overlap)

数据license:

我们按照Google的官方Guideline进行research的release。

同时也依照之前的一些项目 如 Tokyo 24/7 和 CVUSA等数据集采用学校邮箱的方式来发布数据。

基准测试:

主要采用了我之前文章的instance loss,这篇文章是2017年11月放的,最近中了ACM TOMM 2020 用来做图文互搜的,大家有兴趣可以康康,可以用来分类几万类。

主要思想就是把最后分类层的weight 共享,但是前面的特征提取网络还是各归各的。

pytorch 代码在 github.com/layumi/Unive 前面model可以不一样,最后classifier都用同一个。

提供一个baseline, 一方面来验证数据集的有效性,一方面给大家提供一个基础的code,方便大家来修改。

实验结果:

实验结果分几个方面验证:

1、无人机视角是不是比街景定位更好,因为遮挡物更少,同时,无人机还有一个优势就是能拍到屋顶。实验验证了这一点。

2、我们学到的特征是不是比general的特征从大数据集中学到的好。

3、定性结果:(左边无人机目标定位;右边无人机导航)

4、我们的模型能不能拿去在真实的无人机视频中运用呢?

我们分了两个实验, 真实无人机图像搜我们模拟无人机图像:

和 真实无人机图像搜 卫星图:

可以看到还是很work的。

5、对比几个常用baseline,包括contrastive loss, triplet loss等:

6、Instance loss 在其他数据集上(都用VGG16):

7、迁移到传统小的图像检索数据集:

其中Fs是学卫星图+无人机图的子网络, Fg是地面图的子网络。我们猜想,Fs学的是垂直方面的变化,Fg学的还是水平方向的变化,所以针对传统建筑数据集,地面上拍摄的,还是地面的网络Fg更好一些。

参考资料:

论文地址:https://arxiv.org/abs/2002.12186

代码地址:https://github.com/layumi/University1652-Baseline

数据集下载:填写 Request(https://github.com/layumi/University1652-Baseline/blob/master/Request.md) 发送到 Zhedong.Zheng@student.uts.edu.au

探索无人机图像:

https://raw.githubusercontent.com/layumi/University1652-Baseline/master/docs/index_files/sample_drone.jpg

探索卫星图:

https://raw.githubusercontent.com/layumi/University1652-Baseline/master/docs/index_files/sample_satellite.jpg

探索街景图:

https://raw.githubusercontent.com/layumi/University1652-Baseline/master/docs/index_files/sample_street.jpg


遥感与航空影像处理识别交流群

关注最新最前沿的遥感、航空、航天图像处理、分类、识别、检测、分割等技术,扫码添加CV君拉你入群,(如已为CV君其他账号好友请直接私信)

(请务必注明:航拍)

喜欢在QQ交流的童鞋,可以加52CV官方QQ群:805388940。

(不会时时在线,如果没能及时通过验证还请见谅)


长按关注我爱计算机视觉

【新无人机数据集】从行人重识别 到 无人机目标定位相关推荐

  1. 【新无人机数据集】从 行人重识别 到 无人机目标定位

    论文题目:University-1652: A Multi-view Multi-source Benchmark for Drone-based Geo-localization 论文地址:http ...

  2. #超全#行人重识别数据集整理,附下载链接和介绍

    数据集名称 时间 图片尺寸 (总)行人数量/图像 训练集人数/图像 query集人数/图像 gallery 集人数/图像 摄像头数量 图片说明 简介 图片命名 下载链接 文献 1.Market-150 ...

  3. 行人重识别(ReID)数据集大全详细说明

    DukeMTMC-reID 数据集简介 DukeMTMC 数据集是一个大规模标记的多目标多摄像机行人跟踪数据集.它提供了一个由 8 个同步摄像机记录的新型大型高清视频数据集,具有 7,000 多个单摄 ...

  4. 行人重识别(ReID) ——数据集描述 DukeMTMC-reID

    数据集简介 DukeMTMC 数据集是一个大规模标记的多目标多摄像机行人跟踪数据集.它提供了一个由 8 个同步摄像机记录的新型大型高清视频数据集,具有 7,000 多个单摄像机轨迹和超过 2,700 ...

  5. 行人重识别数据集之 DukeMTMC-reID 数据集

    DukeMTMC-reID 数据集 DukeMTMC-reID 数据集简介 DukeMTMC-reID 数据集结构 DukeMTMC-reID 数据集命名规则 参考文献 DukeMTMC-reID 数 ...

  6. 行人重识别的挑战 与 最新进展 (35页PPT整理)

    行人重识别近几年获得了在测试结果上的大幅提升,甚至超过了人的分辨能力,但是我们在实际应用上仍有很多待解决的问题.在本文中,我们take a step back, 提出了一些问题和潜在的解决方案,主要以 ...

  7. 视频行人重识别系统(UI界面,Python源码,可下载)

    下载链接:https://mbd.pub/o/bread/mbd-Y5WVmJpt 演示视频链接:https://live.csdn.net/v/236533 目录: 前言 1.功能及操作说明 2.目 ...

  8. 行人重识别(Person re-identification)概述

    在人的感知系统所获得的信息中,视觉信息大约占到80%-85%.行人重识别(person re-identification)是近几年智能视频分析领域兴起的一项新技术,属于在复杂视频环境下的图像处理和分 ...

  9. 行人重识别(3)——行人重识别(基于图像)综述

    !转载请注明原文地址!--东方旅行者 更多行人重识别文章移步我的专栏:行人重识别专栏 本文目录 基于图像的行人重识别 一.表征学习方法 1.浅层视觉特征 2.中层视觉特征(语义属性) 3.深层视觉特征 ...

最新文章

  1. Oracle.ManagedDataAccess 连接数据库用户名密码错误
  2. 管理大数据存储的十大技巧
  3. 数据分析/数据挖掘/机器学习---- 必读书目
  4. html上传图片(进度条变化)、音乐
  5. 〔转〕Word域的应用和详解2_等式和公式域
  6. c语言程序 题库管理,C语言程序设计题库管理系统-20210412073918.docx-原创力文档
  7. redis设计与实现 二
  8. 微博营销案例 – 运来大师看手相
  9. 基于mina框架的GPS设备与服务器之间的交互
  10. XML学习记录(归纳总结,方便查看)
  11. 为什么说大数据就业前景一片光明?
  12. 给大家介绍一款校园网盘软件,孜创校园网盘软件,搭建学校私有云存储
  13. SpringBoot结合MyBatis 【超详细】
  14. QT开发和MFC开发的经典案例
  15. Emacs - 维基百科,自由的百科全书
  16. 毕业设计、卷积cnn、lstm、random walk、地址交易识别
  17. Html的块状元素和内联元素
  18. 把一个页面进行四等分
  19. 爬虫反混淆入门--JS混淆之ob混淆
  20. 回收wsl2 vdisk空间方法

热门文章

  1. ImageMagick 拆分透明PNG 合并JPG和Alpha Mask
  2. 高等数学基础 - 高等数学主要内容
  3. PHP和MySQL的交互实验注意事项,PHP 和 MySQL 开发中要注意的8个技巧
  4. timestamp显示毫秒_mysql解决datetime与timestamp精确到毫秒的问题
  5. python如何并发运行2个软件_如何利用并发性加速你的python程序(二):I/O 绑定程序加速...
  6. python应用实例论文_浅谈Python在科学计算中的应用
  7. php使用异步redis,PHP Swoole异步Redis客户端实现方法示例
  8. 爬虫用java还是python_网络爬虫是用python比较好,还是Java比较好呢?
  9. php magento 开发,php – Magento:如何将配置更改从开发环境迁移到生产环境?
  10. ssis包部署提示不能与集成身份验证一起使用_何时使用和不使用云原生安全工具...