分享 | 英特尔第二代神经计算棒（Intel Neural Compute Stick 2）相关测试

爱分享的 OpenVINO 中文社区

内容来源| 李栋
内容排版| 李擎
原文链接：https://blog.csdn.net/weixin_43317210/article/details/107030841

正文

英特尔第二代神经计算棒（Intel Neural Compute Stick 2）相关测试

英特尔在2018年正式推出了身材依然只有U盘大小的第二代神经计算棒(Neural Compute Stick 2/NCS 2)，可让开发者更智能、更高效地开发和部署深度神经网络应用，满足新一代智能设备的需求。

NCS 2介绍

NCS 2 仍然类似U盘造型，尺寸只有72.5×27×14毫米，通过USB 3.0 Type-A接口插入主机，兼容64位的 Ubuntu 16.04.3、CentOS 7.4、Windows 10操作系统。
NCS 2内置了最新的 Intel Movidius Myriad X VPU 视觉处理器，集成16个 SHAVE 计算核心、专用深度神经网络硬件加速器，可以极低的功耗执行高性能视觉和AI推理运算，支持 TensorFlow、Caffe 开发框架。
NCS 2 的性能比之前的 Movidius 计算棒有了极大的提升，其中图像分类性能高出约5倍，物体检测性能则高出约4倍。

NCS 2的在深度学习方面的测试

最近通过参加 DFRobot行业AI 开发者大赛，入手了一个 NCS 2。

NCS 2 的主要定位就是在应用于物联网。传统嵌入式设备受价格和体积影响，一般性能比较低（嵌入式设备使用的单片机、树莓派等计算、控制核心的性能肯定比电脑使用的cpu差得多），并不适合做深度学习中有关图像的运算。而 GPU 等设备因为体积较大，价格昂贵等因素，无法应用于物联网的设备端，而且在物联网的设备端只需要训练好的网络模型进行推理，不需要训练，因此在一定程度上来说，GPU用于推理会造成性能过剩。而NCS2则解决了这个矛盾，它的主要定位就是用于物联网的设备端，代替原有设备进行深度学习的推理，实现边缘计算。NCS2的体积较小，价格低，专门用于图像计算，性能高于传统的嵌入式设备，起到了取长补短的功能。

本文主要就是对NCS 2在常用图像分类，目标检测等物联网应用场景进行测试，检测NCS 2在实现深度学习网络的推理中的表现。

测试环境

操作系统：ubuntu 16.04
软件环境：OpenVINO 2019 r1
测试硬件：NCS 2（vpu）
CPU（Intel Core i7-8750H）

测试内容

本部分将4个经典的深度学习模型分别部署在CPU和NCS2，对比了他们的推理性能。

4.1 squeezenet 分类模型测试

在这个部分中，我们将使用 cpu和NCS 2（vpu）分别实现 squeezenet 的推理，实现对下图的分类

首先，利用 OpenVINO 将 squeezenet 图像分类模型部署在cpu上。

CPU 得到的推理结果如下图所示，图片中显示了TOP10分类以及其相应概率，同时可以看到 CPU 在squeezenet的推理速度非常快，可以达到378.231FPS，远远超过普通应用的需求。

同理，利用 OpenVINO 将 squeezenet 图像分类模型部署在 NCS 2（vpu）上。

VPU 得到的推理结果如下图所示，图片中显示了 TOP10 分类以及其相应概率。与CPU的推理结果相比，VPU 推理得到的结果与 CPU 结果的大致相同，但是在具体某种类的概率上有所不同，这是因为 CPU 推理时，使用的是32位的浮点数，而VPU推理的时候使用的是16位的浮点数，因此在具体的概率值上，可能会有轻微的变化，但是在分类的准确度上不会有太大影响。同时可以看到 vpu 在 squeezenet 的推理速度相对 cpu 较慢，为78.89FPS，仍可以满足绝大多数普通需求。

4.2 车牌识别模型测试

这一部分将测试车牌识别模型，车牌自动识别系统如今广泛应用于小区，停车场。实现阻止无关车辆，放行登记车辆，自动缴费等功能。模型将对下列图片中的车牌号进行识别和检测

首先，将模型部署在cpu上测试其性能：

测试结果如下图所示：

模型成功识别出来了车牌号“冀 MD711”，推理速度达到77.01FPS，性能有些过剩，远超普通应用的需求。
将模型应用于 VPU ：

得到的结果如下图所示：

VPU同样正确识别出来了车牌号“冀 MD711”，推理速度达到20.79FPS。可以满足一般应用的需求。

4.3 人脸检测模型测试

人脸检测模型也是在现实生活中广泛引用的深度学习模型，下面将测试一个人脸检测模型在 CPU、VPU上的性能表现。本文测试的模型不仅包含人脸检测，还包括人脸 3D 模型检测，性别判定，年龄预测，表情判定等，因此总体模型比较复杂，具体应用时可以单独选择一项或几项应用。
首先查看模型部署在 CPU 上的性能表现：

在 CPU上，模型的推理速度依然非常快，可以达到38.14FPS。可见高性能的 CPU 即使在如此复杂的模型推理中，依然有些性能过剩。
而VPU的测试结果则如下所示：

在VPU上，模型的推理速度减慢为10.79FPS，在实际应用上可能会显得比较慢。这因为测试的模型比较复杂的缘故，实际应用中，可能并不需要人脸3D模型检测，性别判定，年龄预测，表情判定等全部功能，因此对模型进行简化可以加快其推理速度，使模型成功引用与VPU，替代嵌入式设备的控制核心进行深度学习推理任务。

4.4 GoogleNetV2物体检测模型测试

本部分将测试GoogleNetV2物体检测模型在CPU、VPU上的性能表现。
首先看CPU的性能表现：

检测的速度达到：31.72FPS
然后看VPU的表现性能：

检测的速度达到：13.01FPS
这个结果与4.3的测试结果类似，使用CPU检测性能过剩，而使用VPU推理的速度则稍微变慢。这说明在某些较复杂的模型中单独一个NCS 2可能并不能完全胜任深度学习模型的推理工作，可以考虑将推理任务分组由多个NCS 2完成，或者使用NCS 2作为核心推理设备的加速组件用于加快模型推理。

5 结论

通过以上测试可以得出，Intel推出的NCS 2（VPU）可以作为物联网设备端AI应用的计算核心，胜任诸如图像分类，车牌检测等常用的深度学习模型的推理任务，实现边缘计算的功能。在应用某些较为复杂的模型时，可以使用多个NCS2（VPU）进行协同工作，或者将NCS 2作为核心推理设备的加速组件，加速模型的推理，实现更好的应用。

关注我们，让开发变得更有趣

分享 | 英特尔第二代神经计算棒（Intel Neural Compute Stick 2）相关测试相关推荐

Intel Neural Compute Stick 2代部署步骤
环境介绍: 我是win 7 64位系统,用VMware虚拟机装了个Ubuntu 16.04LTS 64位的linux系统: 接下来是参照Intel给的参考步骤开始部署2代NCS的工作环境. 官方资料: ...

英特尔AIDC2018：神经计算棒二代从天而降，软硬生态合作圈尽露锋芒
允中发自国贸大酒店量子位报道 | 公众号 QbitAI 浩浩荡荡开了一天半的英特尔人工智能大会(AIDC 2018)刚刚结束.在国贸大酒店三层的大宴会厅里,俨然有地主姿态的英特尔在几场演讲中秀 ...

多核处理器_英特尔十代酷睿i5-10400大战R5 3600，到底谁是千元处理器一霸？
Hello大家好,我是兼容机之家的小牛. 要说英特尔十代酷睿中最走量的处理器,莫过于i5 10400这颗千元神U了. 最近我们兼容机之家推出了几款搭载i5 10400等十代酷睿CPU的主机,性价比非常 ...

英特尔11代 16G内存笔记本，为你免费包邮到家
为了回馈长期以来各位老铁对本号的关注支持,更好的去看paper,提高技术水平,直接给你送一个英特尔11代 16G内存高颜值笔记本!两种颜色可供选择,无论是自己用,还是当礼物送人,都比较不错的. 赠送 ...

英特尔显卡linux管理_英特尔 11 代酷睿大揭秘：这次全是大招
英特尔在今年九月份正式推出了第 11 代酷睿移动处理器,这次英特尔将 10 纳米 SuperFin 工艺全面带到移动处理器上,同时还有全新的 Willow Cove 内核.Iris Xe 显卡.全新的 ...

英特尔核显自定义分辨率_华为推出两款MateBook D系列笔记本：搭载英特尔11代酷睿...
12月23日,华为举行新品发布会,除了推出nova 8系列新机外,其还发布了两款MateBook D系列笔记本,型号分别为D14和D15,新款笔记本全系搭载英特尔11代酷睿处理器,有着出色的核显性能. ...

英特尔 11 代酷睿桌面酷睿 i9-11900K登场
根据爆料者 @APISAK 的消息,英特尔 11 代酷睿桌面酷睿 i9-11900K 型号已经出现在了<奇点灰烬>基准测试跑分库里.访问:京东数据显示,i9-11900K 为 8 核 1 ...

Maxtang大唐英特尔12代J6412无风扇双网口迷你主机真实评测
今天为大家评测一款无风扇的双网口迷你主机,这款主机来自于maxtang大唐采用了英特尔12代赛扬J6412处理器,产品最出彩的地方就是它的网络配置,不仅拥有双千兆网口,还搭载了SIM卡插槽,并支持4G ...

openvino只支持英特尔6代以上的cpu
注意:openvino只支持英特尔6代以上的cpu 例子:Intel core i 8250U. 其中,Intel为CPU的生产厂商:core为品牌:i5为系列:8250U中的第一个8代表它为第8代产 ...

intel酷睿游戏计算机,英特尔11代酷睿游戏芯片跑分曝光
11代酷睿桌面处理器(Rocket Lake-S)将于3月份上市开卖,泄露的跑分显示,终极一代14nm配合Cypress Cove架构可谓炉火纯青,单核直接将AMD Zen3斩落马下.戴尔(DELL) ...

最新文章

计算机初中教师资格教案,初中教师资格证教学设计

2021-03-12 Python基础核心概念变量和简单数据类型

python组成不重复的三位数是多少_超星Python 练习实例1-组成多少个互不相同且无重复的三位数字...

Python文件操作中的a，a+,w，w+，rb+,rw+,ra+几种方式的区别

efi分区咋移动到c盘里_怎么手动安装CLOVER到U盘EFI分区

Spring 基于 Java 的配置 - 如何不用Beans.xml照样描述bean之间的依赖关系

vue --- [全家桶] Vuex

大数据学习笔记13：MR案例——显示每年最高温度

php开始页,页码从第四页开始怎么设置

计算机程序丢失或损坏,电脑开机后出现winload.exe丢失或损坏异常的解决方法

matlab神经网络训练精度,关于提高MATLAB神经网络精度的问题

Chrome浏览器显示 Flash不是最新版

android手机外置存储卡,安卓手机内置内存卡和外置内存卡(SD卡)互换方法

网页的背景颜色变化效果

ERP系统应用的流程与步骤

Zookeeper--简介

关于读博的意义的一些感想

Java中将图片转为GIF（实用）

数据库系统概论（知识整理）你值得拥有

robotframework 内置库BuiltIn学习笔记

热门文章

Android自动化刷量、作弊与防作弊视频教程-彭斌-专题视频课程

MDM数据分析设计方案

贝叶斯因果网络_因果关系和贝叶斯网络

《引爆点》学习笔记二

2003年GCT考试真题

红警2补丁和联机网络配置

谈谈今年很火的区块链 CDN

野火ISO-V2学习

linux电子表格工具,Linux系统办公一条龙之电子表格Calc

Devexpress TreeList控件支持拼音首字母查询