英特尔第二代神经计算棒(Intel Neural Compute Stick 2)相关测试

英特尔在2018年正式推出了身材依然只有U盘大小的第二代神经计算棒(Neural Compute Stick 2/NCS 2),可让开发者更智能、更高效地开发和部署深度神经网络应用,满足新一代智能设备的需求。

1 NCS 2介绍

NCS 2 仍然类似U盘造型,尺寸只有72.5×27×14毫米,通过USB 3.0 Type-A接口插入主机,兼容64位的Ubuntu 16.04.3、CentOS 7.4、Windows 10操作系统。
NCS 2内置了最新的Intel Movidius Myriad X VPU视觉处理器,集成16个SHAVE计算核心、专用深度神经网络硬件加速器,可以极低的功耗执行高性能视觉和AI推理运算,支持TensorFlow、Caffe开发框架。
NCS 2的性能比之前的Movidius计算棒有了极大的提升,其中图像分类性能高出约5倍,物体检测性能则高出约4倍。

2 NCS 2的在深度学习方面的测试

最近通过参加DFRobot行业AI开发者大赛,入手了一个NCS 2。

NCS 2的主要定位就是在应用于物联网。传统嵌入式设备受价格和体积影响,一般性能比较低(嵌入式设备使用的单片机、树莓派等计算、控制核心的性能肯定比电脑使用的cpu差得多),并不适合做深度学习中有关图像的运算。而GPU等设备因为体积较大,价格昂贵等因素,无法应用于物联网的设备端,而且在物联网的设备端只需要训练好的网络模型进行推理,不需要训练,因此在一定程度上来说,GPU用于推理会造成性能过剩。而NCS2则解决了这个矛盾,它的主要定位就是用于物联网的设备端,代替原有设备进行深度学习的推理,实现边缘计算。NCS2的体积较小,价格低,专门用于图像计算,性能高于传统的嵌入式设备,起到了取长补短的功能。
本文主要就是对NCS 2在常用图像分类,目标检测等物联网应用场景进行测试,检测NCS 2在实现深度学习网络的推理中的表现。

3 测试环境

操作系统:ubuntu 16.04
软件环境:OpenVINO 2019 r1
测试硬件:NCS 2(vpu)
CPU(Intel Core i7-8750H)

4 测试内容

本部分将4个经典的深度学习模型分别部署在CPU和NCS2,对比了他们的推理性能。

4.1 squeezenet 分类模型测试

在这个部分中,我们将使用cpu和NCS 2(vpu)分别实现squeezenet的推理,实现对下图的分类

首先,利用OpenVINO将squeezenet 图像分类模型部署在cpu上。

CPU得到的推理结果如下图所示,图片中显示了TOP10分类以及其相应概率,同时可以看到CPU在squeezenet的推理速度非常快,可以达到378.231FPS,远远超过普通应用的需求。

同理,利用OpenVINO将squeezenet 图像分类模型部署在NCS 2(vpu)上。

VPU得到的推理结果如下图所示,图片中显示了TOP10分类以及其相应概率。与CPU的推理结果相比,VPU推理得到的结果与CPU结果的大致相同,但是在具体某种类的概率上有所不同,这是因为CPU推理时,使用的是32位的浮点数,而VPU推理的时候使用的是16位的浮点数,因此在具体的概率值上,可能会有轻微的变化,但是在分类的准确度上不会有太大影响。同时可以看到vpu在squeezenet的推理速度相对cpu较慢,为78.89FPS,仍可以满足绝大多数普通需求。

4.2 车牌识别模型测试

这一部分将测试车牌识别模型,车牌自动识别系统如今广泛应用于小区,停车场。实现阻止无关车辆,放行登记车辆,自动缴费等功能。模型将对下列图片中的车牌号进行识别和检测

首先,将模型部署在cpu上测试其性能:

测试结果如下图所示:

模型成功识别出来了车牌号“冀 MD711”,推理速度达到77.01FPS,性能有些过剩,远超普通应用的需求。
将模型应用于VPU:

得到的结果如下图所示:

VPU同样正确识别出来了车牌号“冀 MD711”,推理速度达到20.79FPS。可以满足一般应用的需求。

4.3 人脸检测模型测试

人脸检测模型也是在现实生活中广泛引用的深度学习模型,下面将测试一个人脸检测模型在CPU、VPU上的性能表现。本文测试的模型不仅包含人脸检测,还包括人脸3D模型检测,性别判定,年龄预测,表情判定等,因此总体模型比较复杂,具体应用时可以单独选择一项或几项应用。
首先查看模型部署在CPU上的性能表现:

在CPU上,模型的推理速度依然非常快,可以达到38.14FPS。可见高性能的CPU即使在如此复杂的模型推理中,依然有些性能过剩。
而VPU的测试结果则如下所示:

在VPU上,模型的推理速度减慢为10.79FPS,在实际应用上可能会显得比较慢。这因为测试的模型比较复杂的缘故,实际应用中,可能并不需要人脸3D模型检测,性别判定,年龄预测,表情判定等全部功能,因此对模型进行简化可以加快其推理速度,使模型成功引用与VPU,替代嵌入式设备的控制核心进行深度学习推理任务。

4.4 GoogleNetV2物体检测模型测试

本部分将测试GoogleNetV2物体检测模型在CPU、VPU上的性能表现。
首先看CPU的性能表现:

检测的速度达到:31.72FPS
然后看VPU的表现性能:

检测的速度达到:13.01FPS
这个结果与4.3的测试结果类似,使用CPU检测性能过剩,而使用VPU推理的速度则稍微变慢。这说明在某些较复杂的模型中单独一个NCS 2可能并不能完全胜任深度学习模型的推理工作,可以考虑将推理任务分组由多个NCS 2完成,或者使用NCS 2作为核心推理设备的加速组件用于加快模型推理。

5 结论

通过以上测试可以得出,Intel推出的NCS 2(VPU)可以作为物联网设备端AI应用的计算核心,胜任诸如图像分类,车牌检测等常用的深度学习模型的推理任务,实现边缘计算的功能。在应用某些较为复杂的模型时,可以使用多个NCS2(VPU)进行协同工作,或者将NCS 2作为核心推理设备的加速组件,加速模型的推理,实现更好的应用。

英特尔第二代神经计算棒(Intel Neural Compute Stick 2)相关测试相关推荐

  1. Intel Neural Compute Stick 2代部署步骤

    环境介绍: 我是win 7 64位系统,用VMware虚拟机装了个Ubuntu 16.04LTS 64位的linux系统: 接下来是参照Intel给的参考步骤开始部署2代NCS的工作环境. 官方资料: ...

  2. 英特尔AIDC2018:神经计算棒二代从天而降,软硬生态合作圈尽露锋芒

    允中 发自 国贸大酒店 量子位 报道 | 公众号 QbitAI 浩浩荡荡开了一天半的英特尔人工智能大会(AIDC 2018)刚刚结束.在国贸大酒店三层的大宴会厅里,俨然有地主姿态的英特尔在几场演讲中秀 ...

  3. intel酷睿游戏计算机,英特尔11代酷睿游戏芯片跑分曝光

    11代酷睿桌面处理器(Rocket Lake-S)将于3月份上市开卖,泄露的跑分显示,终极一代14nm配合Cypress Cove架构可谓炉火纯青,单核直接将AMD Zen3斩落马下.戴尔(DELL) ...

  4. Maxtang大唐英特尔12代J6412无风扇双网口迷你主机真实评测

    今天为大家评测一款无风扇的双网口迷你主机,这款主机来自于maxtang大唐采用了英特尔12代赛扬J6412处理器,产品最出彩的地方就是它的网络配置,不仅拥有双千兆网口,还搭载了SIM卡插槽,并支持4G ...

  5. openvino只支持英特尔6代以上的cpu

    注意:openvino只支持英特尔6代以上的cpu 例子:Intel core i 8250U. 其中,Intel为CPU的生产厂商:core为品牌:i5为系列:8250U中的第一个8代表它为第8代产 ...

  6. 英特尔12代酷睿处理器正式发布,驱动人生助力相关驱动下载升级

    英特尔Intel正式揭晓了12代酷睿处理器,在延续多年的旧工艺后,英特尔带领其全新的工艺.全新的混合架构Alder Lake.全新的外型与接口.英特尔像是在宣告他的崛起,未来已来,将掀起一场属于英特尔 ...

  7. 英特尔第十代处理器为什么不支持win7_英特尔10代CPU完美装win7|新主板新CPU装win7 Bios设置...

    英特尔七代.八代和九代CPU都经常有用户问怎么装win7,就算是现在英特尔已经出到了十代CPU,还是会有用户问,怎么装win7,不得不说win7是个在Windows系统中最经典的系统之一,那么inte ...

  8. 英特尔11代 16G内存笔记本,为你免费包邮到家

    为了回馈长期以来各位老铁对本号的关注支持,更好的去看paper,提高技术水平,直接给你送一个英特尔11代 16G内存 高颜值笔记本!两种颜色可供选择,无论是自己用,还是当礼物送人,都比较不错的. 赠送 ...

  9. 英特尔显卡linux管理_英特尔 11 代酷睿大揭秘:这次全是大招

    英特尔在今年九月份正式推出了第 11 代酷睿移动处理器,这次英特尔将 10 纳米 SuperFin 工艺全面带到移动处理器上,同时还有全新的 Willow Cove 内核.Iris Xe 显卡.全新的 ...

  10. 英特尔核显自定义分辨率_华为推出两款MateBook D系列笔记本:搭载英特尔11代酷睿...

    12月23日,华为举行新品发布会,除了推出nova 8系列新机外,其还发布了两款MateBook D系列笔记本,型号分别为D14和D15,新款笔记本全系搭载英特尔11代酷睿处理器,有着出色的核显性能. ...

最新文章

  1. 数据挖掘基础知识-矩阵(分解)
  2. 网易云信荣登「2020中国ToB行业年度先锋力榜」!
  3. Nginx调度器(反向代理)
  4. (五)Unity插件生成
  5. 使用ycsb测试cassandra
  6. 搭建PC架构的ISCSI存储系统
  7. mysql 选择索引_mysql选择索引
  8. pdf pmp书籍第六版_PMP项目管理 第六版 (带目录完整高清版).pdf
  9. 小牛性能服务器图片,【N1S参数篇】性能与体验并肩,N1S参数配置介绍
  10. 【C语言】学生打卡系统(完整代码)
  11. IT计算机实习:JAVA实习报告范文(一)
  12. 使用JQuery TreeTable实现树形表格
  13. 一些BIM的相关概念
  14. wind python接口手册_wind量化平台-用户手册(python).pdf
  15. 使用百度地图时,经纬度坐标正确,但位置只显示北京
  16. android投屏 电视软件,高清电视投屏软件下载-高清电视投屏 安卓版v20200802-PC6安卓网...
  17. 语音信号处理及特征提取
  18. iOS8官方推荐图标和图像尺寸
  19. 智能人物画像综合分析系统——Day16
  20. QTreeWidgetItem设置复选框的禁用状态

热门文章

  1. 【互联网大厂研究】让千千万万底层人民脱贫致富的【快手】,他有何等魔力?
  2. 基于convLSTM模型的雷达图像外推算法
  3. Null(空值)和 Undefined(未定义)
  4. 数商云跨境电商平台解决方案 1
  5. ffmpeg实现视频切割合并
  6. 图像增强—彩色增强技术
  7. 哈佛邓云天:Cascaded Text Generation with Markov Transformers
  8. Postek博思得标签打印机更换电脑,打印出来标签空白
  9. 数电(二)—分析/画逻辑电路图
  10. java点歌系统_Java实现模拟KTV点歌系统