《自然·电子学》杂志封面(资料图,来源:《自然》官网)

来源:Kneron耐能

近日,《自然》杂志子刊《自然·电子学》(Nature Electronics)发表论文《集成忆阻器与CMOS以实现更好的AI》(Integrating Memristors and CMOS for Better AI),介绍了新型忆阻内存元器件结合传统CMOS工艺应用于AI领域的现状,并展望其方向与趋势。论文指出:通过将忆阻阵列与CMOS电路集成,可创建能提供高效DNN处理器的内存计算架构。

论文作者包括:圣母大学计算机科学与工程系博士后姜炜文、耐能工程总监谢必克、耐能创始人兼CEO刘峻诚,以及身兼耐能高级顾问的圣母大学计算机系终身副教授、博士生导师兼电子系终身副教授史弋宇。

为便于中国读者阅读,我们将其翻译成中文,正文部分如下:

深度神经网络(deep neural network, DNN, 图1a)在各种AI应用中的成功,推动了DNN加速器(或AI处理器)的普及,其中包括GPU、FPGA和ASIC。在这些AI处理器的设计中,能效和计算延迟是需要优化的两个关键指标,特别是在网络之间的边界控制数据流的终端平台,如移动和物联网设备(图1b)。

然而,由于DNN存在大量的中间数据,当前基于传统冯·诺依曼架构的AI处理器设计方法都受到“内存墙”的限制,以致在内存和数据路径之间的海量数据移动中花费了过多的时间和电能(图1c)。

冯·诺依曼架构与用于AI终端设备的nvCIM架构:

a,具有卷积运算的典型DNN。

b,基于DNN执行应用程序的目标终端设备,可以使用nvCIM平台。

c,具有独立存储单元和处理单元的传统冯·诺依曼架构,使用GPU、FPGA或ASIC进行卷积运算。

d,基于nvCIM架构的AI处理器,在同一芯片上集成存储和处理单元。该方法使用忆阻器,可存储数据并具有可在存储器中进行卷积运算的计算能力。

为打破这种内存墙,研究人员开发了非易失性内存计算(non-volatile computing-in-memory, nvCIM)架构,它使用nvCIM来存储数据,并直接用这类存储器的计算能力处理数据。

最近关于nvCIM的工作已成功证明,MAC运算——这是DNN中的一项基本运算,可在由忆阻器组成的交叉单元阵列上实现,并可加快DNN的执行。然而,由于缺乏与同一芯片上的外围电路完全集成的存储单元阵列设计,nvCIM的效率增益仍未得到实验证实。

新竹清华大学教授张孟凡(音)及其合作者在《自然·电子学》杂志介绍了一个1Mb的忆阻nvCIM处理器,该处理器将定制控制和读出电路完全集成在一块芯片上。该方法特别集成了单晶体管、单电阻(one-transistor, one-resistor, 1T1R)电阻随机存取存储阵列和65nm制程 CMOS工艺的控制和读出电路。

研究人员使用该nvCIM处理器演示了二个输入、三个加权神经网络,实现了16.95TOPS/W的能效,修改后的数据集在美国国家标准技术研究院(the Modified National Institute of Standards and Technology, NIST)的推断精度达到98.8%。

该处理器可使用两个或三个输入以及MAC运算执行可重构逻辑运算。它在执行三输入布尔逻辑运算时的访问时间仅4.9纳秒,执行MAC运算时的访问时间则为14.8纳秒,这一结果清楚地说明了该方法提供高速运算以加速DNN的潜力。

张孟凡及其合作者使用基于三端1T1R元件的忆阻单元阵列,与传统的二端忆阻单元相比,这种三端1T1R单元可更好地扩展到更大的阵列而减缓功耗增长。该nvCIM处理器还利用数字双模字线驱动器作为行驱动器,它使用小面积数字缓冲器而非典型的数模转换器来提供稳定的模拟电压。

此外,研究人员提出了两种关键的电路级读出技术:小偏移多电平电流模式读出放大器,以及模式和输入自适应参考电流发生器。这些技术可实现低功率高度并行计算的内存运算,并在紧凑区域中克服设备多样性和单元漏电问题从而实现高精度。这些技术也可扩展到更大规模的nvCIM以及其他类型的电阻式存储器和忆阻器件。

张孟凡及其合作者的工作,是开发nvCIM处理器以在终端设备上实现AI的重要一步。但在广泛应用于商业化产品之前,仍有许多问题需要解决:

首先,用于忆阻器的读写电路仍可能在体积、功耗、延迟等方面造成巨大的负担。

其次,忆阻器的电阻状态有限,这要求它们牺牲输入数据或权值的数值精度,导致可能无法进行全精度显示。

然后,多数忆阻器都存在不可预知的问题,例如器件间的相斥、循环耐久性和随时间变化的磨损,需要深入验证它们如何影响AI处理器的性能。为解决这些问题,有必要从软件和硬件的角度探索可能的设计补救措施。

最后,现有基于nvCIM的AI处理器的内存仍然较小,可实现的神经网络对于多数应用来说也过于简单,需要实施大规模系统才能真正展示其实际能力。

这篇论文,是耐能团队在AI学术研究领域的最新成果之一。近年来,耐能团队已发表多篇核心论文并获得多项国际专利,并充分应用于终端AI芯片与解决方案的研发。其中,耐能创始人兼CEO刘峻诚的研究成果主要包括:

1

2019年

美国专利:卷积运算器件和方法(Operation Device and Mmethod for Convolutional Neural Network)

2

2018年

美国专利:缓冲器、卷积运算器件和方法(Buffer Device and Convolution Operation Device and Method)

美国专利:人工神经元及其控制方法(Artificial Neuron and Controlling Method Thereof)

3

2017年

美国专利:多层人工神经网络及其控制方法(Multi-Layer Artificial Neural Network and Controlling Method Thereof)

美国专利:3D集成电路(3D Integrated Circuit)

IEEE论文:用于物联网的可重构流式深度卷积神经网络加速器(A Reconfigurable Streaming Deep Cconvolutional Neural Network Accelerator for Internet of Things)

UCLA论文:硬件机器学习系统电路不确定性综合解决方案(Comprehensive Solutions to Circuit Uncertainty for Hardware Machine Learning System)

关于《自然·电子学》

《自然·电子学》(Nature Electronics)创刊于2018年1月,是《自然》系列科研期刊面向电子学领域的专业子刊,采取在线出版与订阅模式。

《自然·电子学》涵盖电子学各领域的基础和应用研究,从新现象和设备的研究直至电子电路的设计、制作以及更广泛的应用,其核心是关注新技术的发展并了解其对社会所产生的影响。


《崛起的超级智能》一书主要阐述当今天人类为人工智能的春天到来而兴奋,为人工智能是否超越人类而恐慌的时候,一个更为庞大、远超人类预期的智能形态正在崛起,种种迹象表明50年来,互联网正在从网状结构进化成为类脑模型,数十亿人类智慧与数百亿机器智能通过互联网大脑结构,正在形成自然界前所未有的超级智能形式。这个新的超级智能的崛起正在对人类的科技,产业、经济,军事,国家竞争产生重要而深远的影响。

作者:刘锋   推荐专家:张亚勤、刘慈欣、周鸿祎、王飞跃、约翰、翰兹

未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

耐能团队论文登上《自然·电子学》:集成忆阻器与CMOS以实现更好的AI相关推荐

  1. 首次!我国以计算机系为第一完成单位的论文登上《自然》

    点击上方"码农突围",马上关注 这里是码农充电第一站,回复"666",获取一份专属大礼包 真爱,请设置"星标"或点个"在看&quo ...

  2. numpy如何直接在数组上进行添加_NumPy 论文登上了 Nature!

    ? "Python猫" ,一个值得加星标的公众号 剧照 | <小妇人> 机器之心报道 编辑:魔王.杜伟.小舟 NumPy 团队撰写了一篇综述文章,介绍 NumPy 的发 ...

  3. #今日论文推荐# 朱松纯团队最新研究:机器人可与人类“推心置腹”!还说下一步要造“AI大白”

    #今日论文推荐# 朱松纯团队最新研究:机器人可与人类"推心置腹"!还说下一步要造"AI大白" 机器人能否像<超能陆战队>中的"大白&quo ...

  4. 上传 录音_老罗推荐的是最好吗?AI旗舰录音笔对比评测

    录音笔已经成为商务职场人群.记者人群.或者一些特殊职业比如文字创作者.律师的必备产品.以小编为例,经常新闻会议.发布会.甚至是内部的选题会都需要这样的产品.而目前这类产品已经逐步的智能化,小编就选取市 ...

  5. 【HTML5初探之form标签】解放表单验证、增加文件上传、集成拖放

    导航 [初探HTML5之使用新标签布局]用html5布局我的博客页! [HTML5初探之form标签]解放表单验证.增加文件上传.集成拖放 [HTML5初探之绘制图像(上)]看我canvas元素引领下 ...

  6. Asp.Net Core Web Api图片上传(一)集成MongoDB存储实例教程

    Asp.Net Core Web Api图片上传(一)集成MongoDB存储实例教程 原文:Asp.Net Core Web Api图片上传(一)集成MongoDB存储实例教程 Asp.Net Cor ...

  7. Article:AI领域2021年度总结与2022年度展望:多模态人工智能起飞、万亿参数模型的爆发、生成模型在音乐电影制作上的进展、Transformer架构正在以一己之力统一AI江湖、AI法律监管

    Article:AI领域2021年度总结与2022年度展望:多模态人工智能起飞.万亿参数模型的爆发.生成模型在音乐电影制作上的进展.Transformer架构正在以一己之力统一AI江湖.AI法律监管 ...

  8. 目前CSDN上最全面的C语言讲解如何用更高层次编写嵌入式C代码

    目前CSDN上最全面的C语言讲解如何用更高层次编写嵌入式C代码 前言 本文首先分析了C语言的陷阱和缺陷,对容易犯错的地方进行归纳整理:分析了编译器语义检查的不足之处并给出防范措施,以Keil MDK编 ...

  9. foxmail服务器协议,foxmail客户端上pop3、imap协议应该怎么选择?哪个更好-上海腾曦网络[foxmail]...

    foxmail客户端上pop3.imap协议应该怎么选择?哪个更好? 作者:腾讯企业邮箱客户端    发布时间:2021-01-18 19:13:51  访问量:857  来源:foxmail 导读: ...

最新文章

  1. 2022-2028年中国塑料制品行业投资分析及前景预测报告(全卷)
  2. 前后端分离的接口规范
  3. 按需生产 ,我们准备好了吗?
  4. excel行转列_excel统计函数:应用广泛的动态统计之王OFFSET(上)
  5. php固定空格,使用php校对(固定标点符号,空格,大写字母)生物页面文本
  6. AndroidStudio打开新项目后解决下载某版本gradle慢的问题
  7. 4.python合并excel多个sheet
  8. 光纤收发器的AB端可随便连接吗?
  9. gensim实现Doc2Vec和Word2Vec
  10. JAVA中的线程安全与非线程安全,java面试题,java高级笔试题
  11. c++连接mysql的中文编码问题
  12. 获取 python import模块的路径
  13. 会议管理系统java_javaweb会议管理系统
  14. 吉他入门:吉他音阶训练入门教程(二)
  15. Python 制作藏头诗生成器(超详细)
  16. MongoDB secondary节点
  17. 同样是学编程,为什么别人十几岁就成了黑客,而你还在做码农
  18. JavaEE_Swagger
  19. springboot传图片到前端之有手就行
  20. 学生用计算机怎么没音效,电脑有声音用播放器没有声音怎么处理啊???

热门文章

  1. 收集了7000个地震回波后,机器学习发现了地下上千公里处的热岩床
  2. 独家 | 基于TextRank算法的文本摘要(附Python代码)
  3. 赠票 | 深度强化学习的理论、算法与应用专题探索班
  4. 教你在Python中用Scikit生成测试数据集(附代码、学习资料)
  5. 黄仁勋入选《时代》杂志2021最具影响力100人,库克、马斯克也上榜
  6. 高校招聘!事业编制,年薪高达150万,提供安家费及购房补贴,硕士研究生及以上学历...
  7. 谷歌“亲儿子”竟然成为了NLP革新者
  8. 【剑指Offer专题】链表系列:从尾到头打印链表、反转链表、回文链表、合并两个排序的链表(C++和Python实现)...
  9. SAP MM MIGO 移动类型242将固定资产转物料库存
  10. 当YOLOv5遇见OpenVINO