前几天英伟达开源了DG-Net的源码。让我们来回顾一下这篇CVPR19 Oral的论文。

论文是英伟达(NVIDIA), 悉尼科技大学(UTS), 澳大利亚国立大学(ANU)的研究人员 在CVPR19上口头报告的文章《 Joint Discriminative and Generative Learning for Person Re-identification》。 深度学习模型训练时往往需要大量的标注数据,但收集和标注大量的数据往往比较困难。作者在行人重识别这个任务上探索了 利用生成数据来辅助训练的方法。通过生成高质量的行人图像,将其与行人重识别模型融合,同时提升行人生成的质量和行人重识别的精度。

论文链接:https://arxiv.org/abs/1904.07223
B 站视频: https://www.bilibili.com/video/av51439240/
腾讯视频: https://v.qq.com/x/page/t0867x53ady.html

代码地址:https://github.com/NVlabs/DG-Net

代码运行效果:(训练100000次迭代)

开发环境:

  • Python 3.6
  • GPU Memory >= 15G 如果使用fp32精度
  • GPU Memory >= 10G 如果使用fp16精度,可以节省一部分显存
  • NumPy
  • PyTorch 1.0+
  • [Optional] APEX (使用fp16要安装)

数据集下载地址:

采用的是Market-1501 数据集 http://www.liangzheng.com.cn/Project/project_reid.html

训练好的模型下载:

  • 百度网盘:https://pan.baidu.com/s/1503831XfW0y4g3PHir91yw  password: rqvf
  • GoogleDrive:https://drive.google.com/open?id=1lL18FZX1uZMWKzaZOuPe3IuAdfUYyJKH

测试效果如下:

  • 行人重识别的精度:

  • 生成的行人图像:

训练的命令很简单:

选项已经内置到yaml文件中,若按照全精度fp32来运行,约占用15G显存。

python train.py --config configs/latest.yaml

若使用半精度训练,则只使用约10G显存。

python train.py --config configs/latest-fp16.yaml

训练的log可使用tensorboard 来查看

 tensorboard --logdir logs/latest

作者简介
本文的第一作者郑哲东是悉尼科技大学计算机科学学院的博士生,预计2021年 6 月毕业。该论文是其在英伟达实习期间的成果。

郑哲东目前已经发表8篇论文。其中一篇为ICCV17 spotlight,被引用超过了300次。首次提出了利用GAN生成的图像辅助行人重识别的特征学习。一篇TOMM期刊论文被Web of Science选为2018年高被引论文,被引用超过200次。同时,他还为社区贡献了行人重识别问题的基准代码,在Github上star超过了1000次,被广泛采用。

另外,论文的其他作者包括英伟达研究院的视频领域专家 - 杨晓东、人脸领域专家禹之鼎(Sphere Face,LargeMargin作者)、行人重识别专家郑良博士,郑哲东的导师杨易教授(今年有三篇 CVPR oral 中稿)、和英伟达研究院的副总裁 Jan Kautz。

源代码来了 | 英伟达开源行人生成/重识别代码相关推荐

  1. 英伟达开源行人生成/重识别代码

    map 86% 论文链接: https://arxiv.org/abs/1904.07223 B 站视频:  https://www.bilibili.com/video/av51439240/ 腾讯 ...

  2. 英伟达开源自动驾驶AI算法,升级芯片性能7倍于Xavier

    2019-12-18 13:24:27 乾明 编辑整理  量子位 报道 | 公众号 QbitAI 一年一度,英伟达GTC China如期举办. 今年的英伟达创始人黄仁勋,对自动驾驶极为关注. 不仅发布 ...

  3. 【AI 简报20201018期】英伟达开源「Imaginaire」、智能手表争夺战是如何打响的?

    导读:本期为 AI 简报 20201018期,将为您带来过去一周关于 AI 新闻 9 条,其他互联网圈内新闻 8 条,希望对您有所帮助~ 有更好的建议或者意见请在下方留言~ AI 1. 图神经网络新课 ...

  4. 快速图像增强的简便大法来了,英伟达开源新库代号“DALI”| CVPR 18

    林鳞 编译整理 量子位 出品 | 公众号 QbitAI 又有新的开源库来了,英伟达出品,数量×2. 正在举行的CVPR 2018大会上,英伟达开源了数据增强库NVIDIA DALI和图像解码库NVID ...

  5. 业界 | 英伟达开源硬件加速项目NVDLA:一种标准化的推断加速框架

    https://cloud.tencent.com/developer/article/1119468 目录 业界 | 英伟达开源硬件加速项目NVDLA:一种标准化的推断加速框架 使用 NVDLA 加 ...

  6. 英伟达开源深度学习加速器介绍

    数字逻辑设计的开源项目非常少,这一方面是因为门槛比较高,学生很难验证学习:另一方面是项目迭代反馈的周期很长.比较有名的开源代码网站当属OpenCore,它的官方网站是:https://opencore ...

  7. ffmpeg学习 源代码编译、英伟达硬件加速

    使用cpu进行软编解码时,cpu效率低并且占用高.使用硬件加速,能够明显降低CPU的占用,参看博客 ffmpeg学习(16)AVDevice使用. 这里以使用英伟达gpu进行h264编解码加速为例说明 ...

  8. AI + 3D!英伟达开源3D深度学习框架Kaolin

    点击我爱计算机视觉标星,更快获取CVML新技术 3D计算机视觉在医学影像.自动驾驶.机器人深度感知.视频游戏.虚拟和增强现实中有重要应用. 近日,英伟达新开源了kaolin深度学习框架,旨在加速3D计 ...

  9. 英伟达用GAN生成脑瘤图像,训练出的AI医生,准确率提高16%

    栗子脑 发自 凹非寺 量子位 出品 | 公众号 QbitAI 辅助医生做疾病诊断的AI,已越来越常见. 从前,每只AI要吃下来自放射科的许多许多图像数据,学好图中的特征,才可能出师. 数据集越大越好, ...

最新文章

  1. leetcode算法题--最小路径和
  2. python 条形图_Python数据可视化:基于matplotlib绘制「堆积条形图」
  3. Microsoft BizTalk ESB Toolkit 2.0
  4. 如何用轻量协作工具做bug管理
  5. 数据结构--二叉树与森林记事本
  6. YUI3 Overlay的使用
  7. ansible、ansible tower的安装以及基本使用
  8. 微信小程序地图实现展示路线路
  9. Photoshop2018安装
  10. 神经影像(核磁共振)概念及数据分析学习
  11. linux 无线网卡 频段,Linux 网卡配置 (频段、发射功率等)
  12. Bootstrap3源码分析
  13. ZZNU 1992: 情人节的尴尬
  14. MongoDB LBS经纬度查询操作
  15. ReactNative Animated动画详解
  16. 百度CarLife Android车机端黑屏问题
  17. 表白套路计算机公式,高级表白密码我喜欢你公式 套路喜欢的人
  18. ValueError: binary mode doesn‘t take an encoding argument
  19. 互联网金融之应用系统安全开发规范
  20. 华为设备:清除配置详解

热门文章

  1. hpux 操作系统 磁带备份与恢复
  2. 爬虫基础知识记录の二
  3. 我的世界服务器兑换系统怎么做,Minecraft我的世界村民交易方法及兑换表格
  4. 黄**解说的各种版本
  5. qt5应用程序打包发布和qt5的mysql驱动编译
  6. 小游戏《恶梦》的总结
  7. 推箱子游戏 java源代码_java推箱子游戏源代码(含推箱子的判断)
  8. 百度开源的 71 个项目,不了解一下?
  9. 【成电860考研】经验贴汇总(公共课+专业课+复试)-扒遍所有网站:信软群、王道、知乎、csdn等,截止21年7月整理出的所有帖子-共15篇
  10. 低压无功补偿电容柜浅谈