12月15日,光子计算芯片公司曦智科技(Lightelligence)发布了其最新高性能光子计算处理器:PACE(Photonic Arithmetic Computing Engine,光子计算引擎)。该处理器单个光子芯片中集成超过10,000个光子器件,运行1GHz系统时钟,运行特定循环神经网络速度可达目前高端GPU数百倍。

曦智科技创始人兼CEO沈亦晨博士在MIT(麻省理工学院)的主要研究方向便是光子AI计算,并与Nicholas Harris一起在2017年《自然-光学》发表论文(Deep learning with coherent nanophotonic circuits),。谈到将光路应用于机器学习任务,比如语音和图像识别。他们的设计被评为“代表了使用光的神经网络最关键构建块之一的真正并行实现,现代代工厂可以轻松地批量制造这种类型的光子系统。”这意味着芯片的光子计算机可能会成为一个市场巨大的业务,每个要使用神经网络进行决策的设备都会用到一个光子计算机。

而后便创立了曦智科技,与MIT的朋友、师长一起组成了创始团队,主要精力都集中在科研成果的转化上。至今4年多的时间里,一步一步将这项技术从最初的实验室,转化到一个接近于可以商业量产的阶段。

沈亦晨表示,自2012年后,神经网络的大小和计算模型的大小出现了爆炸式的增长。2012年以后,平均每3到4个月,计算模型的大小就会翻一倍。和2012年相比,我们现在最大的神经网络的模型大概是当时的15到30万倍左右,目前模型的增长还在持续,但是明显受制于算力底层的限制,制约了人工智能的进一步发展。

如今电子芯片发展面临的三个主要瓶颈在于算力、数据传输、存储三个方面。

算力瓶颈主要来源于两方面,第一个方面是摩尔定律。在过去近50年里,晶体管的密度可以每18到20个月翻一倍。这也是大家通常所说的28纳米、12纳米、7纳米、5纳米的支撑。如今已经发展到5纳米的芯片可以量产,台积电日后也会推出3纳米的芯片。从物理角度来讲,其实一个原子大小就有接近0.3纳米,3纳米的制程实际上已经非常接近物理极限,所以纳米的支撑再向前演进也不可能像过去50年那样不断翻倍;第二个算力限制主要是功耗和发热角度。2015年后,随着晶体管越来越小,面临着比较严重的问题,就是晶体管上的隧穿现象。就算晶体管变小了,功耗也不能显著降低,这也是电子芯片进一步提高算力的主要破瓶颈,算力瓶颈直接决定了单位面积电芯片上能做的计算密度,已经很难再提高了。进一步提高算力的唯一办法就是扩大电芯片的面积,但芯片面积越大,在数据传输上的功耗就会显著增长,功耗的比例也会越来越大。这是从本质上制约了我们用一块更大的电芯片去完成算力突破的一个主要原因。

如今用光代替电解决部分计算,成为了突破现有破瓶颈的有效途径。在数据搬运上,光已经在光通信领域充分证明其领先性和优势了。目前所有长距离通信,包括数据中心里服务器和服务器之间的数据都是通过光纤代替铜导线进行的。光进入到芯片去帮助运算是一个必然的方向。

另外,如今大数据、人工智能越来越多都是在做现行计算,曦智科技也发现了用光高校做线性计算的方式。光子芯片的高通量、低功耗、低延时等特点,在未来的计算处理器市场有着广阔的前景。

PACE处理器的结构由光芯片和电芯片两部分组成。电芯片上主要做数据的存储和数模混合的调度,光芯片上主要做数据的计算。最后,光和电芯片会做3D封装技术倒装的堆叠。通过重复矩阵乘法和巧妙利用受控噪声组成的紧密回环来实现低延迟,从而生成伊辛问题(Ising)和最大割 / 最小割问题(Max-cut / Min-cut)的解决方案。

PACE包含64x64的光学矩阵,核心部分由一块集成硅光芯片和一块CMOS微电子芯片以3D封装形式堆叠而成。对于每个光学矩阵乘法,输入向量值首先从片上存储中提取,由数模转换器转换为模拟值,通过电子芯片和光子芯片之间的微凸点应用于相应的光调制器,形成输入光矢量。接着,输入光矢量通过光矩阵传播,产生输出光矢量,并达到一组光电探测器阵列,从而将光强转换为电流信号。最后,电信号通过微凸点返回到电子芯片,通过跨阻放大器和模数转换器返回数字域。测试显示,PACE的运算速度可达目前高端GPU的数百倍。

曦智科技创始人兼首席执行官沈亦晨博士表示:“PACE的发布具有里程碑式的意义:它成功验证了光子计算的优越性,为集成电路产业提供了新的发展路径。此外,它还充分展示了光子芯片与传统电子芯片无缝协同的运作方式,而这一切要归功于曦智科技光电封装团队的3D封装创新。”

在此之前,全世界集成度最高的硅光产品大概只有几个或十几个光器件。为了做光计算,曦智科技需要把集成度提高三到四个数量级,达到几万个光器件,这是在工程层面最大的挑战。如果去设计简单的几个光器件的芯片,还可以手动完成芯片设计。但如果需要放几万个器件在一个芯片上时,所有传统芯片的设计模式可能就都没有办法用了,所有的东西都要做成自动化,需要有一个自动化检测的过程。它在中间涉及到的问题,包括设计本身、任何器件都不能出错。曦智科技相当于从头开发了一个高集成度光芯片的整个设计流程。

另外,封装方式的变化也充满着挑战。传统光芯片的每一个器件的控制都是通过铜导线外接到板卡上面,通过一个外部的器件去控制光芯片上的东西。但当有上万个光器件在芯片上的时候,那些外接的封装方式就没有办法适用,因此必须开发出一种用一块电芯片去控制光芯片的一套3D的封装方式。

还有更进一步,比如说当有几万个光器件和电芯片一起深度协同的时候,发号施令的是电芯,那我们怎么能够同时给上万个光的器件去发号施令,并能够在纳秒的级别让它统一有序地进行运算?这里就涉及到了软硬集成,架构层面的努力,这些都是相当复杂的工程问题,也是沈亦晨团队过去不断在解决的问题。

沈亦晨博士说道:“未来,曦智科技将通过一个高集成、低功耗、不受摩尔定律限制的平台进一步为数据中心、云计算、金融和自动驾驶等领域提供前所未有的算力,让世界因‘光’而不同。”

最新光子计算处理器面世:单个光子芯片集成超万个光子器件,频率达1GHz相关推荐

  1. 曦智科技发布最新光子计算处理器PACE

    成功验证光子计算优越性,以光子技术突破集成电路产业边界 2021年12月15日,全球领先的光子计算芯片公司曦智科技(Lightelligence)发布了其最新高性能光子计算处理器--PACE(Phot ...

  2. 数字化转型:当光子计算遇上金融领域

    原标题为[光子计算在金融领域的研究应用--聚焦"光子金融科技"新方向] 作者 | 吴永飞 王彦博 沈亦晨 杨璇 光子计算作为前沿尖端技术之一,近年来蓬勃发展.逐步成熟,目前已基本具 ...

  3. zen3架构_全新Zen3架构,AMD发布最新Ryzen5000系列处理器

    在AMD新发布的四款处理器中,AMD表示新款Ryzen 5900X是"世界上最好的游戏CPU".在揭晓Zen 3系列处理器的同时,AMD还透露了一些Zen 4的细节,工艺升级至5n ...

  4. 量子计算还没搞懂,光子计算又要来统治世界?

    [CSDN 编者按]去年 12 月,量子计算原型机"九章" 惊人的单项计算能力超过了 Google 当年水平,国人自己也手握一份"量子霸权",新年伊始,两篇关于 ...

  5. 光子的双缝干涉实验:只有单个光子才能产生所谓的干涉现象

    只有单个光子才能产生所谓的干涉现象 写在最前面 杨氏双缝实验 写在最前面 这篇文章只讨论一个我总结出来的重要结论: 只有单个光子才能产生所谓的干涉现象! 两个光子不会产生干涉! 如果你认为光是波, 那 ...

  6. 深圳灵明光子发布自主研发3D传感芯片,初步具备量产能力

    澎湃新闻(www.thepaper.cn)从深圳市灵明光子科技有限公司方面获悉,7月13日,该公司发布了自主研发.采用全球先进背照式3D堆叠工艺技术的dToF单光子成像传感器(SPAD image s ...

  7. 怎么看vray渲染进度_3dmax如何渲染光子,为什么会卡光子呢?

    文末推荐靠谱云渲染插件. 在我们使用3D MAX制图,VRay渲染器出图时,会先做一遍跑光(计算光子),以此节约我们最终渲染出图的时间. 首先,光子贴图.跑光到底是什么,有什么用? 左边是渲染的图像, ...

  8. 十年磨一剑,可重构计算架构将引领未来芯片市场

    2019 年 6 月,AI 芯片创业公司清微智能首款可重构计算架构 AI 芯片实现量产的消息在业内迅速传开,可重构计算架构芯片再次引发一波讨论的热潮.经历过十多年的技术积累,这枚小小的芯片在全球芯片市 ...

  9. 从端到边缘,无线技术赋能AI边缘计算处理器

    ---------------------------------------------------------------------------------------------------- ...

最新文章

  1. Go开发之路 -- Go语言基本语法 - 作业
  2. Kernel i2c gpio spi pinctrl platform 分析讲解 (未完待续)
  3. IOS性能调优系列:使用Time Profiler发现性能瓶颈
  4. Ubantu 16.04中文输入问题解疑
  5. 反欺诈之地址的处理和使用
  6. 一个免费调用的OData服务,无需用户名密码,适用于SAP UI5的学习
  7. 发现以前的一些记录 shutdown AP CPU
  8. android 游戏的源程序代码类型,代码准备重写实现网络游戏 [开源]历时5天一款完整的文字策略养成类型游戏完成了...
  9. dos2unix介绍
  10. 毫米波雷达的点云形式与分辨能力详解!
  11. HTML5工程师利用原生js开发百度搜索黑洞漩涡特效
  12. 曲线与曲面的微分几何
  13. 第7章 Stata相关性分析
  14. 在计算机中安装Manjaro
  15. 听书 app,学习用途
  16. 一级计算机快捷键大全,计算机快捷键大全(最全篇)
  17. 利用beef盗取浏览器cookie,并实现页面跳转
  18. Linux - Unix环境高级编程(第三版) 代码编译
  19. 学习Android系统
  20. Qt 仿360悬浮球

热门文章

  1. 科学计数法_第一章 科学计数法与近似数
  2. 在html中 正确的嵌套方式是( ).,HTML及网页制作练习题-完整版
  3. mysql触发器可以使用正则表达式_SQL 正则表达式及mybatis中使用正则表达式
  4. 22岁何同学自制硬核AirDesk!苹果都做不来的超大充电桌,稚晖君点赞
  5. 梅宏院士:步入软件定义的时代
  6. 化学方程式作评、数学上成知识百科……那些“别人家的老师”有何特别?
  7. 9个细节告诉你,达摩院过去一年做了啥
  8. 【计算几何】线段相交
  9. Effective Java 在工作中的应用总结
  10. 比开源快30倍的自研SQL Parser设计与实践