用软件可编程FPGA加速网络边缘的移动应用

Accelerating Mobile Applications at the Network Edge with Software-Programmable FPGAs

FPGA加速的意义

如今边缘计算已经成为一种用于移动应用程序的新的计算范式,可以提高性能和能耗。具体来说,它通过将计算密集型的任务卸载到邻近的边缘节点,助力电力有限设备上的交互式应用程序。同时,现场可编程门阵列(FPGA)因其硬件可定制性而以高性能和节能的方式加速深度学习算法等计算密集型任务而闻名,已被证明是一个有吸引力的加快计算密集型工作负载的解决方案。此外,FPGA已经被用于云计算的计算加速。

基于边缘卸载和基于FPGA加速的优势,将这两种技术结合起来,进一步提高边缘计算的响应性能,可以在网络边缘部署基于FPGA的加速器,从计算卸载的角度加速移动应用程序。

挑战

如何将边缘卸载和基于FPGA加速两种技术结合起来,如何实现。

方案

系统总体架构如图所示。它由一个移动设备、一个边缘节点(代表边缘网络)和一个云组成。

移动设备通过Wi-Fi连接到边缘节点。它主要运行应用程序的前端部分,与计算卸载模块进行接口,用于发送请求(例如原始传感器数据),并通过UI接收特定于应用程序的响应。

边缘网络由无线路由器和ARM-FPGA板通过以太网连接而成。它有两个主要组件,即卸载管理器模块和计算卸载模块。卸载管理器模块在路由器上实现,用于与前端应用程序接口,并将数据路由到卸载目标(本地计算卸载模块或远程云)。

被用来提供传统的基于CPU的云卸载的基准性能。

基于该方案实现了三个交互式应用程序:识别给定图像手写数字,识别给定图像物体,人脸检测。手写数字识别采用了相对简单的深度学习模型,物体识别采用了相对复杂的深度学习模型,人脸不使用深度学习方法,而是基于传统的计算机视觉算法。这些应用程序都是计算密集型的,预计将受益于边缘卸载方法。

开放问题

在我们的实验中,没有对FPGA和另一种广泛使用的硬件GPU进行比较。一般来说,GPU可以实现更高的吞吐量,在大多数情况下峰值速度通常比FPGA快。然而,FPGA可以降低单个请求的延迟,同时消耗更少的能量。我们可以看到FPGA在大多数情况下更节能。此外,FPGA的可重构特性使其比GPU更加灵活。考虑到这些方面,我们认为FPGA是边缘卸载的更好选择。

我们实验中的应用都与计算机视觉有关。而如今,涉及音频和语音处理的应用正在兴起,并成为交互式应用的重要组成部分。此类应用的最先进解决方案大多基于深度学习和机器学习算法。利用FPGA加速音频和语音处理应用的研究已经开始。因此,我们相信基于FPGA的边缘卸载也能够加速涉及音频和语音的应用程序。

我们的工作没有考虑太多关于网络边缘的独特特性。我们尝试在网络边缘使用FPGA,使应用程序运行更快,并验证其有效性,而不是考虑边缘计算的独特情况来优化工作负载。

开发高效的FPGA加速器是困难的。CPU程序对于大多数程序员来说都很熟悉,并且有很多基于CPU的工作可以用于交互式应用程序。相比之下,开发FPGA程序需要程序员对应用程序和FPGA都有良好的知识。开发周期长得多,而且由于代码可读性差,很难调试硬件程序。

第三,目前FPGA板上的处理器频率远远低于笔记本电脑或虚拟机的CPU。也就是说,板载协同处理器可能成为基于FPGA的边缘卸载的瓶颈。幸运的是,这些问题可以通过FPGA设计工具和硬件性能的发展来解决。

见解

是,这些问题可以通过FPGA设计工具和硬件性能的发展来解决。

见解

边缘卸载对于改善当今交互应用程序的用户体验很有吸引力,由于其强大的计算能力和能源效率,FPGA在加速计算密集型工作负载(如深度学习算法)方面表现非常好。本文试图结合边缘卸载和FPGA的优点,在网络边缘部署FPGA来加速交互式移动应用,提出了一种新的网络辅助计算模型,即基于FPGA的边缘计算。虽然基于FPGA的边缘卸载仍处于初级阶段,但我们相信,这篇论文有助于考虑利用新设备和技术来改善边缘计算背景下的移动应用。

用软件可编程FPGA加速网络边缘的移动应用总结相关推荐

  1. 超低功耗Lattice SensAI引领网络边缘人工智能设备迈向大众市场

    全新的毫瓦级功耗FPGA解决方案 为机器学习推理在大众市场物联网应用中实现快速部署创造机遇 将AI加速部署到快速增长的消费电子和工业IoT应用,如移动设备.智能家居.智慧城市.智能工厂和智能汽车产品 ...

  2. 云网融合 全栈赋能:英特尔加速网络转型 释放智能边缘价值

    5G正式商用两年来,在产业链共同努力下,中国5G发展成效显著.在建成全球规模最大.技术最为领先的5G基础网络的同时,在5G垂直行业应用方面也涌现了大批优秀案例. 作为领先的网络芯片提供商,英特尔始终携 ...

  3. 高级综合(high-level-synthesis,HLS):软件算法在FPGA上实现硬件加速的综合工具

    目录 高级综合HLS(high-level-synthesis):软件算法在FPGA上实现硬件加速的综合工具 HLS简述 HLS应用背景 HLS基本要素 HLS优势 小结 高级综合HLS(high-l ...

  4. 阿里云张毅萍:构建边缘云全站加速网络体系

    简介:2021年6月9日,亚太内容分发大会暨CDN峰会在北京举行,阿里云边缘云网络高级技术专家张毅萍受邀参会,分享了阿里云在构建边缘云全站加速网络体系的实践,基于边缘云节点支撑各种应用协议的分层传输加 ...

  5. 快手团队长文解读:基于FPGA加速的自动语音识别在大规模直播和短视频场景的应用...

    来源:机器之心 本文约6000字,建议阅读10分钟 本文介绍了基于FPGA加速的自动语音识别在大规模直播和短视频场景的应用. 典型的实时流式自动语音识别业务如语音搜索.语音输入等和用户操作相关,直接影 ...

  6. 用FPGA加速卷积神经网络的知识储备

    用FPGA加速卷积神经网络的知识储备 1.FPGA 1.FPGA分类 2.开发工具 3.开发工具2 2.卷积神经网络 1.卷积神经网络基础 2.开发语言 3.总结 参考内容 本文是我经过一段时间学习的 ...

  7. AI周报丨快手团队长文解读:基于FPGA加速的自动语音识别在大规模直播和短视频场景的应用

    AI周报 - 热门论文 - 题目:On Training Implicit Models 本文主要研究无限层隐式模型的训练问题.具体地说,以前的工作采用隐式微分,并为反向传播计算精确的梯度.然而,是否 ...

  8. 总结-软件工程师 ( 编程能力 )

    总结-软件工程师 ( 编程能力 ) 软件工程师编程能力前言 /* 编码现状 */ 程序猿现状: 现项目不是白做的,的确知道怎么写代码,怎么做出一个界面,怎么发起一个网络请求... 仅此而已了.不知道如 ...

  9. FireSim简介-亚马逊云-伯克利合作项目-公共云中FPGA加速的周期精确扩展系统仿真-ISCA18

    论文:Karandikar S , Mao H , Kim D , et al. FireSim: FPGA-Accelerated Cycle-Exact Scale-Out System Simu ...

最新文章

  1. WTForms 小计1 forms
  2. JavaScript ES2015
  3. eclipse android logcat 只显示自己应用程序信息的设置方法
  4. Python练习 | Python中的运算符
  5. php json注释,【部分解决】Json中添加注释
  6. 禅道项目管理_禅道项目管理软件 v12.5.1 开源版
  7. shell中字分隔的妙用:变量IFS
  8. ArcGIS中实现将圆16等分
  9. 你的实力就等于别人对待你的态度
  10. Unity编辑器扩展之EditorWindow
  11. 0018计算机应用基础国考考试大纲,《计算机应用基础》考试大纲
  12. 十个优秀的在线音乐分享网站
  13. 速学堂java面试题_速学堂JAVA300集 第四章作业练习题
  14. 关于谷歌浏览器安装油猴插件失败的解决方法
  15. 罗马数字 java_Java算法练习——整数转罗马数字
  16. 西安交大计算机考研分数线2020院线,西安交大考研分数线2020院线_全国硕士研究生招生考试网...
  17. 快捷打开mysql_Windows 平台快速启动MYSQL的方法
  18. 炒股杠杆-AI量化交易
  19. 【vbs脚本】02.高级
  20. 打破网络上不实的健康新闻 朕亨公益教你如何辨识新闻真假

热门文章

  1. Java 实现OCR 识别图像文字(手写中文)----tess4j
  2. 位运算——强大得令人害怕
  3. log4j漏洞分析及总结
  4. 2021-06-04 Java对象在Hibernate下的4种状态和Session相关方法以及对象识别
  5. 一台电脑如何开俩虚拟机_虚拟机轻松实现一台电脑两人用
  6. 开源生态学初探——从生命游戏开始
  7. 【THUSC2017】【LOJ2977】巧克力 斯坦纳树
  8. 剑指offer——丑数
  9. python实现从文件查找关键字
  10. WinDbg调试的前因后果