文章目录

  • 1 14.2
    • 1.1 整体架构
    • 1.2 帧间数据复用
    • 1.3 卷积数据复用
      • 1.3.1 point-wise卷积(1x1卷积)
      • 1.3.2 depth-wise卷积
      • 1.3.3 普通卷积
  • 2 2.4

1 14.2

  • 题目:A 65nm 24.7μ μJ/Frame 12.3mW Activation-Similarity-Aware Convolutional Neural Network Video Processor Using Hybrid Precision, Inter-Frame Data Reuse and Mixed-Bit-Width Difference-Frame Data Codec
  • 研究机构:清华刘勇攀
  • 参考文章:http://www.gongkong.com/news/202002/401140.html

视频有个特点,帧与帧之间相似度很大,能否复用这部分的数据呢?复用这部分的数据有很大的好处:

  • 数据分布很小
  • 如果用高位宽表示,如8bit,数据还是很稀疏
    这会带来三个挑战
  1. 如何复用数据又不会造成精度损失?
  2. 如果在不同的卷积中利用数据,处理稀疏性?
  3. 带宽有限,如何减少数据读写?

1.1 整体架构

这里的accelerator有三个关键特征:

  1. 利用视频数据中帧间相似性,在传统帧内数据复用基础上新增了帧间复用维度,实现了在不损失网络精度的前提下提高计算速度的效果
  2. 根据神经网络计算的数据复用与稀疏模式,设计了可配置三种卷积模式的计算单元和带累加功能的存储单元,提高了网络层内数据利用效率和帧间数据复用
  3. 针对帧间数据复用模式,设计了两通路变比特长度片上片下数据压缩模块,有效降低数据传输量。

整个芯片包括4个PE cluster,每个cluster有32KB activation和8KB权重SRAM

1.2 帧间数据复用

上一帧的结果算完了,先存起来,计算两个网络之间的差值,记得ReLU操作需要恢复出原来的数值,然后把结果相加就好,很牛逼的想法
通常差值都很小,有很多零,而且位宽也很小,可能能到4bit,当然也可能需要8bit,为了不造成精度误差,4bit还是8bit可以动态选择

1.3 卷积数据复用

计算结构如下图,activation竖着走复用,权重横着走复用

1.3.1 point-wise卷积(1x1卷积)

同一竖行,是同一个activation和不同kernel相同位置的权重相乘
不同竖行,是不同的activation,但是不同竖行的权重是一样的

1.3.2 depth-wise卷积

同一竖行,是同一个activation和同一个kernel的同一列的权重相乘

reuses one-column of intra-kernel data with one activation

1.3.3 普通卷积


2 2.4

  • 题目:A 7nm High-Performance and Energy-Efficient Mobile Application Processor with Tri-Cluster CPUs and a Sparsity-Aware NPU
  • 研究机构:三星

文献阅读(19)ISSCC 2020相关推荐

  1. 【预训练视觉-语言模型文献阅读】VL-BERT: PRE-TRAINING OF GENERIC VISUAL- LINGUISTIC REPRESENTATIONS(ICLR 2020)

    [预训练视觉-语言模型文献阅读]VL-BERT: PRE-TRAINING OF GENERIC VISUAL- LINGUISTIC REPRESENTATIONS(ICLR 2020) 文章目录 ...

  2. 文献阅读---多年生黑麦草种质中与耐热性相关的生理性状、分子标记和叶绿素分解代谢基因的自然变异

    文献阅读-多年生黑麦草种质中与耐热性相关的生理性状.分子标记和叶绿素分解代谢基因的自然变异 本文献于2020年11月发表 杂志:BMC Plant Biology 1. 研究背景 (1)多年生黑麦草简 ...

  3. 文献阅读笔记:EvolveGraph: Multi-Agent Trajectory Prediction with Dynamic Relational Reasoning

    文献阅读笔记 摘要 1 引言 2 相关工作 3 Problem formulation 4 EvolveGraph 5 Experiments 6 结论 EvolveGraph: Multi-Agen ...

  4. 知云文献翻译打不开_比有道更好用的英文文献阅读翻译神器免费啦

    知云文献翻译软件免费啦!您扫下面二维码就就可以得到,不需转发朋友圈.不配一款神器,科研哪来效率!有了这款神器,科研都变得更简单! 用它直接打开英文pdf文献,随便选中一段话,右侧立即给出翻译,不再需要 ...

  5. 知云文献阅读器_知云文献翻译

    记得点击蓝字关注我们哦! 外文文献看不懂! 翻译直译太牵强! 相见恨晚的PDF文献阅读翻译软件---知云文献翻译. 知云文献翻译软件既是一款阅读英文pdf文献或pdf书籍的翻译软件,同时也是一款功能非 ...

  6. 文献阅读High-throughput sequencing of the transcriptome and chromatin accessibility in the same cell

    文献阅读汇报 High-throughput sequencing of the transcriptome and chromatin accessibility in the same cell ...

  7. 细胞亚器文献阅读二~An ER-Mitochondria Tethering Complex Revealed by a Synthetic Biology Screen

    细胞亚器文献阅读二~An ER-Mitochondria Tethering Complex Revealed by a Synthetic Biology Screen 通过合成生物学筛选ER和Mi ...

  8. 文献阅读总结:网络表示学习/图学习

    本文是对网络表示学习/图学习(Network Representation Learning / Graph Learning)领域已读文献的归纳总结,长期更新. 朋友们,我们在github创建了一个 ...

  9. 【转载】关于文献阅读和科研选题

    本文转载自程明明老师博客:https://mmcheng.net/paperreading/ ‎ 对于论文的阅读和研究脉络的梳理很清晰,特别是在于找研究方向的建议上:从开山文献开始,会到当事人的角度去 ...

  10. 文献阅读:Improving neural networks by preventing co-adaptation of feature detectors

    文献阅读:Improving neural networks by preventing co-adaptation of feature detectors ----通过防止特征检测器的共适应以改进 ...

最新文章

  1. 【编程之外】为什么我们要写技术博客?
  2. C#中 ??、 ?、 ?: 、?.、?[ ] 问号
  3. 继电反馈法自整定_基于继电反馈PID自整定方法在Buck―Boost电路中应用.doc
  4. python数据分析图表展示_1行代码实现Python数据分析:图表美观清晰,自带对比功能丨开源...
  5. oracle视图执行脚本,Sh脚本中查询Oracle v$视图时需要在$号前加转义符“\”
  6. ruby打印_Ruby程序打印一个数字的乘法表
  7. 对pca降维后的手写体数字图片数据分类_知识干货-机器学习-TSNE数据降维
  8. php 串行化数据,PHP中的串行化变量和序列化对象
  9. 记录——《C Primer Plus (第五版)》第九章编程练习第一题
  10. 51 单片机 建立 文本文件_笔记系列之单片机原理及应用1
  11. 网易2018校园招聘编程题真题 合唱
  12. 房地产“产权分割制”是什么大杀器?
  13. 成都拓嘉启远电商:拼多多单号批量导入如何操作
  14. 计算机创造奇迹的英语作文,大学英语作文:创造奇迹-Creating-Miracle.docx
  15. 微信小程序 获取用户昵称 头像 性别...『并解决获取的头像模糊问题』
  16. 13种老人不适合带孩子_让老人带娃却遭怒摔!细数13种不适合带孩子的老人!...
  17. latex如何设置行间距和段间距
  18. 什么是云计算的?云计算的定义、特征、模型分别是什么?
  19. element ui table 报错 type check failed for prop “showOverflowTooltip“. Expected Boolean, got Stri
  20. 屏幕分辨率、DPI、PPI、GIS里面的地图分辨率

热门文章

  1. 西门子阀门定位器常见的故障代码以及解决方法
  2. java获取局域网所有ip_java如何获取局域网内全部IP?
  3. JEB动态调试debug模式
  4. 苹果电脑装系统只有W ndows,苹果MAC电脑双系统教程——MAC安装Windows双系统教程...
  5. 【敏捷2.2】极限编程XP
  6. layui 时间控件 只显示时分或者分秒
  7. 学习【阿里巴巴Java开发手册-嵩山版】
  8. NodeJS集成Redis实战
  9. 教育行业剧变:校讯通将死 家校沟通永生
  10. java后端 解决app接口版本管理问题