主讲人 | 何琨 英伟达
量子位编辑 | 公众号 QbitAI

3月26日,英伟达图像处理系列公开课第三期线上开播,来自NVIDIA开发者社区的何琨老师,与数百位开发者共同探讨了:

  • 利用NVIDIA迁移式学习工具包构建SSD目标检测网络的推理引擎

  • 将推理引擎迁移到以Jetson Nano为核心的Jetbot智能小车上

  • 在Jetbot智能小车上部署推理引擎

应读者要求,我们将分享内容整理出来,与大家分享。直播中主要的live coding环节受限于文字描述,还请大家观看直播回放(文末附有PPT、直播回放链接) 。

以下为本次分享的内容整理:

大家好,我是来自NVIDIA开发者社区的何琨。我的每次分享都会给大家展示这张图。

它很好的诠释了深度学习的架构,从应用角度来说,视觉、语音识别、NLP等是目前发展较快的领域。市面上有很多框架支持这些深度学习的应用,如Caffe、TensorFlow、PyTorch等,而支撑起这些框架的基础是强大的计算能力。

NVIDIA提供了大量的GPU、边缘设备等,为深度学习框架、推理训练提供了强大的支撑能力。在英伟达CUDA生态系统上,建立了cuDNN、TensorRT、DeepStream SDK、cuBLAS等一系列工具,都是中层的框架应用的基础的内容。

今天分享的主题是“利用迁移式学习工具包加速Jetbot智能小车的推理引擎部署”,首先介绍下这两个工具。

迁移式学习工具包

NVIDIA迁移式学习工具包(Transfer Learning Toolkit,简称TLT)是一个基于Python的工具包,它提供了大量预先训练的模型,并提供一系列的工具,使流行的网络架构适应开发者自己的数据,并且能够训练、调整、修剪和导出模型,以进行部署。

也就是说,我们使用TLT时,就不需要再掌握(上图)左侧这些工具了,大大提高深度学习工作流的效率和精度。

TLT提供了很多训练好的模型,(上图)列举了30多种常用的预训练模型,后面也将推出更多预训练模型,大家可以在NGC(https://www.nvidia.cn/gpu-cloud/)上下载。

选好预训练模型后,我们可以通过TLT对其进行训练、剪枝、再训练等。一键输出后的模型可以直接在DeepStream和TensorRT上使用;优化加速后可以部署在移动端或嵌入式产品上,比如自动驾驶汽车、无人机上。

Jetbot智能小车

Jetbot是以Jetson Nano为计算核心的自动驾驶小车模型。Jetson Nano的体积非常小,只有巴掌大小,但是可以提供470GFLOPS的计算能力。

Nano支持多种接口、双电源,为我们的训练与部署深度学习模型提供了便利。

上图是我去年参加的无人车驾驶比赛的现场,大家可以看到,Jetbot小车能够识别路牌、建筑物,自己找到路径,其计算核心就是Jetson Nano。

上图是Jetbot升级版本的赛车,可以看出它的速度非常快。我们在推理时最高达到了60FPS的速度。实际应用中,为了平衡摄像头的编解码,我们将推理速度减少到45FPS。

上图展示了Jetbot在复杂的环境中自动避障、识别路径的过程,这些功能都是基于深度学习在视觉领域的应用。

我们可以看到,Jetbot小车上有一个前端摄像头,几个控制接口,两个主动轮、一个从动轮,便于大家控制和实践。

我们可以自己设置或直接使用设置好的函数。

前端摄像头的视频接口。我们不需要考虑怎么调用前端摄像头,代码中已经设置好了。

深度学习模型推理接口。


实战:部署一辆Jetbot小车

接下来,何琨老师展示了如何用TLT训练模型,以及在Jetbot上运行模型。受限于文字描述,欢迎大家点击链接观看直播回放(第25分钟起):

直播链接:https://info.nvidia.com/303606-ondemand.html

PPT地址:https://www.nvidia.cn/content/dam/en-zz/zh_cn/assets/webinars/2020/mar26/TLT--2020.03.26.pdf

传送门

第一期课程:利用 NVIDIA 迁移式学习工具包和Deepstream实现实时目标检测

>>直播回放:https://info.nvidia.com/272903-ondemand.html

>>PPT:https://www.nvidia.cn/content/dam/en-zz/zh_cn/assets/webinars/2020/feb27/TLT--2020.02.27.pdf

第二期课程:利用TensorRT 7.0部署高速目标检测引擎

>>直播回放链接:https://info.nvidia.com/291730-ondemand.html

>>PPT:https://www.nvidia.cn/content/dam/en-zz/zh_cn/assets/webinars/2020/mar12/dev/TLT--2020.03.12.pdf

作者系网易新闻·网易号“各有态度”签约作者

—  —

<英伟达NLP公开课> 开始报名啦,4月9号晚8点,英伟达GPU计算专家将分享 FasterTransformer 2.0 的原理与应用,分享如何针对 decoder 和 decoding 进行优化。

戳二维码,备注“英伟达”即可报名、加交流群,主讲老师也会进群与大家交流互动哦~

直播报名 | Decoder与Decoding的优化与加速

天文航天亲子社群招募,一起来玩吧~

2020年是个天文大年,4月8日有全年最大的超级月亮,6月有横跨中国的日环食,8月有英仙座流星雨,10月还有两年一次的火星冲日,12月有双子座流星雨。

我们邀请「美国国家地理极致中国探享家刘允」和天文爱好者们,组建了一个天文航天亲子社群,群里除了交流天文航天知识,还会组织一系列讲座、线下观星、航天探访活动。

如果你有宝宝,也热爱天文航天,一起来玩啊。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「在看」吧 !

英伟达公开课 | 手把手教你部署一辆高速目标检测Jetbot智能小车相关推荐

  1. 英伟达公开课 | 如何突破Decoder性能瓶颈?揭秘FasterTransformer2.0的原理与应用,已开源...

    位来 发自 凹非寺 量子位 报道 | 公众号 QbitAI 4月9日,英伟达x量子位分享了一期nlp线上课程,来自NVIDIA的GPU计算专家.FasterTransformer 2.0开发者之一的薛 ...

  2. 手把手教你用yolov3模型实现目标检测教程(一) - 环境配置

    手把手教你用yolov3模型实现目标检测(一) 写在前面: 由于项目需要,使用yolov3模型做了各种现实场景物体的目标检测.做完了过了好长时间,感觉有些遗忘,还是该留下点东西,方便自己查找,也希望能 ...

  3. Centos8安装英伟达显卡驱动并通过docker部署深度学习环境

    20201107 - 每个人的机器和实际需要的环境都不一样,本文只是提供了在自己实验室centos8上的部署过程,部署过程中,没有什么问题.请谨慎参考本篇文章,以免浪费宝贵时间. 0. 引言 之前的时 ...

  4. 股价暴跌14% 英伟达人工智能第一股的美梦就要破碎?

    持续下降的营收,让人工智能第一股英伟达的股价收到巨大的挑战. 早在2018年2月的时候,英伟达$英伟达(NVDA)$ 明显是一个逆势上升的股票,远远比AMD$AMD(AMD)$ 更有吸引力.纵然美股市 ...

  5. 英伟达单季营收72亿美元:市值达9393亿美元 涨幅超过一个阿里

    雷递网 雷建平 5月26日 人工智能企业英伟达(NVIDIA)日前发布财报.财报显示,截至2023年4月30日的季度,英伟达营收为71.9亿美元,较上年同期的82.88亿美元下降13%,较上一季度的6 ...

  6. 使用NeMo快速完成NLP中的信息抽取任务 | 英伟达NLP公开课

    信息抽取(IE)是从非结构化.半结构化的可读文档或其他电子表示来源中自动提取结构化信息的任务.信息抽取技术为文本挖掘.智能检索.智能对话.知识图谱.推荐系统等应用提供了基本的技术支持. NeMo是英伟 ...

  7. 入门NLP、实现语音识别和语音合成,用这个开源工具SoEasy | 英伟达NLP公开课

    对话式AI正在改变人机交互方式,在生活和工作中给我们带来很大便利. 然而,对话式AI包含自动语音识别.自然语言处理.语音合成等技术领域,从0开发一个对话式AI需要投入的成本和流程非常之多. 那么,有什 ...

  8. 基于百度英伟达EasyDL公开课的学习笔记

    本文是基于智东西公开课<零算法基础的百度EasyDL定制化图像识别揭秘>整理的学习笔记 本文非广告,标注单纯是出于尊重智东西和EasyDL的知识产权 如若涉及侵权,请联系本人 作者:李皮皮 ...

  9. amd显卡用黑苹果输出黑屏_教大家黑苹果英伟达免驱显卡黑屏怎么解决的方法

    现在越来越多的小伙伴对于教大家黑苹果英伟达免驱显卡黑屏怎么解决的方法这方面的问题开始感兴趣,因为大家现在都是想要熟知,那么既然现在大家都想要知道教大家黑苹果英伟达免驱显卡黑屏怎么解决的方法,小编今天就 ...

最新文章

  1. 【FFmpeg】ffmpeg中函数返回的错误码:AVERROR及AVERROR_*
  2. 服务器论坛有哪些_SEO工作中,经常使用的无效外链有哪些?
  3. [Ruby]转载: 关于ruby中 %Q, %q, %W, %w, %x, %r, %s 的用法
  4. CentOS6虚拟机下面配置双网卡
  5. 关于mysql-connector-net在C#中的用法
  6. DO、DTO、BO、AO、VO、POJO定义
  7. 最常用的15个前端表单验证JS正则表达式
  8. 四元数插值方法Slerp/Squad/Spicv/Sping知识总结思维导图
  9. VS2005-此计算机上已安装了试用版。必须先卸载以前安装的试用版后才能安装另一个试用版
  10. 剑指offer面试题[4]-空格替换
  11. HDU 4293 Groups (线性dp)
  12. java repl_Java REPL – jshell
  13. java线程条件变量_Java线程:条件变量 lock
  14. 魅蓝s6手机sim卡不显示无服务器,科普OPPOA57怎么截图及魅蓝S6怎么插卡
  15. Linux分卷压缩后,Windows解压缩
  16. 1.Cookie和Session
  17. 技术干货 | MindSpore AI科学计算系列(三):SciML分析
  18. c语言中变量属性,C语言学习笔记--C语言中变量的属性关键字
  19. 15-移动端布局基础——DPI、PPI、物理像素、DPR、viewportcss像素、DPR
  20. 【搜索】B055_LQ_梅花桩(bfs / 贪心)

热门文章

  1. 用户画像解决方案视频教程
  2. struts2_对Map进行双层迭代
  3. 牛客网平台常州大学新生寒假训练会试
  4. 区块链:这项颠覆性技术将如何改变未来
  5. [转]开发网路游戏的延迟处理方法,广播
  6. ANDROID 中设计模式的採用--创建型模式
  7. 《系统分析与设计方法》 计算投资回收分析
  8. android Fragments详解五:与activity通讯
  9. vs2005打开vs2008
  10. html轮播图鼠标可以暂停,为什么better scroll轮播鼠标点击就会暂停?