天使之眼,一种可编程且灵活的CNN加速架构,以及data quantization策略和编译工具。

CNN的有着高计算量和存储能力,需要先简化再将其mapping到嵌入式fpga上。

为了解决CNN模型的高计算复杂度,data quantization策略有助于将位宽降到8位,精度损失可以忽略不计。该策略在给定位宽的每一层中找到最佳的半径点位置,之后再用额外的转换器来校正数据。

CALC指令,设置片上存储器中的数据块的地址和大小。

angle-eye分割矩阵,充分利用芯片上的缓冲区,外部内存用于保存网络的所有参数和每个层的结果。

提出了一种编译器来将网络描述符map到指令中。主要是按照一定的规则进行块分区,将外部内存空间用于处理器和CNN加速器之间的通信。

该编译工具可以有效地将某个CNN模型maping到硬件上。在ZynqXC7Z045平台上进行评估,在同一平台上Angel-Eye与同等级的FPGA运行相比,处理速度快了6倍,驱动效率高了5倍。使用NIVIDATK1和TX1平台进行比较。天使之眼实现了目标定位,并且能效提高了16倍。

Angel-Eye: A Complete Design Flow for Mapping CNN onto Embedded FPGA阅读笔记相关推荐

  1. Angel-Eye: A Complete Design Flow for MappingCNN onto Embedded FPGA

    天使之眼:将CNN映射到嵌入式FPGA 摘要:卷积神经网络(CNN)已成为人工智能领域的一种成功的算法,也是许多计算机视觉(CV)算法的强大候选算法.但CNN的计算复杂度远高于传统算法.在GPU加速的 ...

  2. Traffic Flow Forecasting: Comparison of Modeling Approaches文献阅读笔记(一)

    今天开始陆续更新之前文章的阅读笔记,有一些文章是辅助实验简单读的,有一些文章是精读的.这里也不做分类了,只是每次在开头提一下相关信息. 文章链接:戳我 主要工作:描述了历史 平均值.时间序列.神经网络 ...

  3. TMAXug ATPG Design Flow

    文章目录 如何启动tmax运行脚本 本篇博客介绍TMAXug系列的 ATPG Design Flow ATPG process是一个产生测试向量的过程,让ATE设备能够识别到正确的电路与fault 电 ...

  4. Real-time noise-aware tone mapping阅读笔记

    <Real-time noise-aware tone mapping> G Eilertsen, RK Mantiuk, J Unger - ACM Transactions on Gr ...

  5. 论文阅读笔记 1.《Open Flow: Enabling Innovation in Campus Networks》(2022.12.22)

    论文阅读笔记 1.<Open Flow: Enabling Innovation in Campus Networks>(2022.12.22) 一.论文主要内容 二.对 OpenFlow ...

  6. USART - Design Flow

    目录 1. baud_clk_gen 1.1. RTL Coding 2. usart_tx 2.1. FSM Design RTL Coding 3. usart_rx 3.1. FSM Desig ...

  7. Physical Design Flow

    设计流的物理设计阶段也称为"place and route"阶段.这是基于物理放置电路的想法,该电路形成逻辑门并代表特定的设计,以便可以制造电路.典型的物理设计流程始于决定设计的 ...

  8. SLAM综述阅读笔记二:Simultaneous Localization and Mapping: A Survey of Current Trends in Autonomous(2017)

    转自[第八篇 SLAM:自动驾驶当前趋势综述 - 知乎] 说明该总结主要是针对自动驾驶 <Simultaneous Localization And Mapping: A Survey of C ...

  9. 阅读笔记-Modulation and Coding Design for Simultaneous Wireless Information and Power Transfer

    缩写说明 WPT: wireless power transfer WIT: wireless information transfer SWIPT: simultaneous wireless in ...

  10. Class Activation Mapping (CNN可视化) Python示例

    Class Activation Mapping 论文:CVPR2016<Learning Deep Features for Discriminative Localization> 代 ...

最新文章

  1. TortoiseSVN找不到系统指定路径
  2. go使用之-编译约束
  3. Linux定时检测内存,若使用率超过指标,重启Tomcat并清空内存
  4. MYSQL的函数有哪些?(3.字符串函数)
  5. 天地图 android sdk,我想使用天地图sdk,第三方插件的教程走通了,现在卡住了
  6. Linux vi 行尾 ctrl,linux中vi使用技巧常用技巧和高级替换
  7. 《深入浅出DPDK》读书笔记(六):报文转发(run to completion、pipeline、精确匹配算法、最长前缀匹配LPM)
  8. 【muduo源码分析 】 MutexLock和MutexLockGuard封装
  9. HDU4675【GCD of scequence】【组合数学、费马小定理、取模】
  10. C#中如何调用动态链接库DLL
  11. IBatis.Net学习笔记三--两种常用的DAO
  12. java数组实验心得体会_JAVA实验报告心得
  13. Redis 模糊查询Key
  14. 彻底清除微软拼音输入法
  15. 台式计算机usb接口无反应6,教你电脑usb接口不能用的解决方法
  16. 12306官方抢票服务,铁路候补购票服务扩大到全部旅客列车!
  17. Linux-查看进程
  18. 【Redis详细安装教程】
  19. ansible 高级自动化变量及变量过滤器
  20. paper code sota 方法

热门文章

  1. Android实现校园新闻APP,基于android平台的校园新闻app的开发 大学毕业论文.doc
  2. 范数、损失函数、标准差
  3. 在d盘创建文件夹,里面有aaa.txt/bbb.txt/ccc.txt,然后遍历出aaa文件夹下的文件(新手用于记录每天的作业)...
  4. Module not found: Error: [CaseSensitivePathsPlugin]
  5. 【安全资讯】2021年值得关注的10大网络安全工具
  6. 林熙蕾和吴大维分手,和元大小开马维辰交往,真实性有待考验
  7. 手写深度学习之优化器(SGD、Momentum、Nesterov、AdaGrad、RMSProp、Adam)
  8. 高速学英语- 大脑的不同学习机制
  9. Capstone 专注HDMI转VGA DP转VGA DP转HDMI DP转LVDS TYPEC转HDMI拓展方案+设计PCB板图
  10. docker xware下载慢_【原创】基于Docker实现迅雷远程下载