源代码来了 | 英伟达开源行人生成/重识别代码
前几天英伟达开源了DG-Net的源码。让我们来回顾一下这篇CVPR19 Oral的论文。
论文是英伟达(NVIDIA), 悉尼科技大学(UTS), 澳大利亚国立大学(ANU)的研究人员 在CVPR19上口头报告的文章《 Joint Discriminative and Generative Learning for Person Re-identification》。 深度学习模型训练时往往需要大量的标注数据,但收集和标注大量的数据往往比较困难。作者在行人重识别这个任务上探索了 利用生成数据来辅助训练的方法。通过生成高质量的行人图像,将其与行人重识别模型融合,同时提升行人生成的质量和行人重识别的精度。
论文链接:https://arxiv.org/abs/1904.07223
B 站视频: https://www.bilibili.com/video/av51439240/
腾讯视频: https://v.qq.com/x/page/t0867x53ady.html
代码地址:https://github.com/NVlabs/DG-Net
代码运行效果:(训练100000次迭代)
开发环境:
- Python 3.6
- GPU Memory >= 15G 如果使用fp32精度
- GPU Memory >= 10G 如果使用fp16精度,可以节省一部分显存
- NumPy
- PyTorch 1.0+
- [Optional] APEX (使用fp16要安装)
数据集下载地址:
采用的是Market-1501 数据集 http://www.liangzheng.com.cn/Project/project_reid.html
训练好的模型下载:
- 百度网盘:https://pan.baidu.com/s/1503831XfW0y4g3PHir91yw password: rqvf
- GoogleDrive:https://drive.google.com/open?id=1lL18FZX1uZMWKzaZOuPe3IuAdfUYyJKH
测试效果如下:
- 行人重识别的精度:
- 生成的行人图像:
训练的命令很简单:
选项已经内置到yaml文件中,若按照全精度fp32来运行,约占用15G显存。
python train.py --config configs/latest.yaml
若使用半精度训练,则只使用约10G显存。
python train.py --config configs/latest-fp16.yaml
训练的log可使用tensorboard 来查看
tensorboard --logdir logs/latest
作者简介
本文的第一作者郑哲东是悉尼科技大学计算机科学学院的博士生,预计2021年 6 月毕业。该论文是其在英伟达实习期间的成果。
郑哲东目前已经发表8篇论文。其中一篇为ICCV17 spotlight,被引用超过了300次。首次提出了利用GAN生成的图像辅助行人重识别的特征学习。一篇TOMM期刊论文被Web of Science选为2018年高被引论文,被引用超过200次。同时,他还为社区贡献了行人重识别问题的基准代码,在Github上star超过了1000次,被广泛采用。
另外,论文的其他作者包括英伟达研究院的视频领域专家 - 杨晓东、人脸领域专家禹之鼎(Sphere Face,LargeMargin作者)、行人重识别专家郑良博士,郑哲东的导师杨易教授(今年有三篇 CVPR oral 中稿)、和英伟达研究院的副总裁 Jan Kautz。
源代码来了 | 英伟达开源行人生成/重识别代码相关推荐
- 英伟达开源行人生成/重识别代码
map 86% 论文链接: https://arxiv.org/abs/1904.07223 B 站视频: https://www.bilibili.com/video/av51439240/ 腾讯 ...
- 英伟达开源自动驾驶AI算法,升级芯片性能7倍于Xavier
2019-12-18 13:24:27 乾明 编辑整理 量子位 报道 | 公众号 QbitAI 一年一度,英伟达GTC China如期举办. 今年的英伟达创始人黄仁勋,对自动驾驶极为关注. 不仅发布 ...
- 【AI 简报20201018期】英伟达开源「Imaginaire」、智能手表争夺战是如何打响的?
导读:本期为 AI 简报 20201018期,将为您带来过去一周关于 AI 新闻 9 条,其他互联网圈内新闻 8 条,希望对您有所帮助~ 有更好的建议或者意见请在下方留言~ AI 1. 图神经网络新课 ...
- 快速图像增强的简便大法来了,英伟达开源新库代号“DALI”| CVPR 18
林鳞 编译整理 量子位 出品 | 公众号 QbitAI 又有新的开源库来了,英伟达出品,数量×2. 正在举行的CVPR 2018大会上,英伟达开源了数据增强库NVIDIA DALI和图像解码库NVID ...
- 业界 | 英伟达开源硬件加速项目NVDLA:一种标准化的推断加速框架
https://cloud.tencent.com/developer/article/1119468 目录 业界 | 英伟达开源硬件加速项目NVDLA:一种标准化的推断加速框架 使用 NVDLA 加 ...
- 英伟达开源深度学习加速器介绍
数字逻辑设计的开源项目非常少,这一方面是因为门槛比较高,学生很难验证学习:另一方面是项目迭代反馈的周期很长.比较有名的开源代码网站当属OpenCore,它的官方网站是:https://opencore ...
- ffmpeg学习 源代码编译、英伟达硬件加速
使用cpu进行软编解码时,cpu效率低并且占用高.使用硬件加速,能够明显降低CPU的占用,参看博客 ffmpeg学习(16)AVDevice使用. 这里以使用英伟达gpu进行h264编解码加速为例说明 ...
- AI + 3D!英伟达开源3D深度学习框架Kaolin
点击我爱计算机视觉标星,更快获取CVML新技术 3D计算机视觉在医学影像.自动驾驶.机器人深度感知.视频游戏.虚拟和增强现实中有重要应用. 近日,英伟达新开源了kaolin深度学习框架,旨在加速3D计 ...
- 英伟达用GAN生成脑瘤图像,训练出的AI医生,准确率提高16%
栗子脑 发自 凹非寺 量子位 出品 | 公众号 QbitAI 辅助医生做疾病诊断的AI,已越来越常见. 从前,每只AI要吃下来自放射科的许多许多图像数据,学好图中的特征,才可能出师. 数据集越大越好, ...
最新文章
- leetcode算法题--最小路径和
- python 条形图_Python数据可视化:基于matplotlib绘制「堆积条形图」
- Microsoft BizTalk ESB Toolkit 2.0
- 如何用轻量协作工具做bug管理
- 数据结构--二叉树与森林记事本
- YUI3 Overlay的使用
- ansible、ansible tower的安装以及基本使用
- 微信小程序地图实现展示路线路
- Photoshop2018安装
- 神经影像(核磁共振)概念及数据分析学习
- linux 无线网卡 频段,Linux 网卡配置 (频段、发射功率等)
- Bootstrap3源码分析
- ZZNU 1992: 情人节的尴尬
- MongoDB LBS经纬度查询操作
- ReactNative Animated动画详解
- 百度CarLife Android车机端黑屏问题
- 表白套路计算机公式,高级表白密码我喜欢你公式 套路喜欢的人
- ValueError: binary mode doesn‘t take an encoding argument
- 互联网金融之应用系统安全开发规范
- 华为设备:清除配置详解