作者 | 胡巍巍
出品 | CSDN(ID:CSDNnews)

7年前,笔者曾在北京一家外贸公司实习,公司业务之一,是给在华的俄罗斯人,邮寄物品到他们国家。

邮寄的物品,一般都是成吨的衣服、或日用品等,这些客户多是从中国进货,然后在当地售卖。

有一次,来了一位金发俄罗斯小伙,他邮寄的东西很特殊,是一把剑。

那是我第一次感受到,剑就像中国功夫一样,很受老外欢迎。

中国最早的剑,从轩辕黄帝时代开始。

剑,承载着人们对正义的向往。

春秋战国的神话传说《列子·汤问》,曾提到过一把叫含光的剑。

这把剑,看上去无形,舞起来无影,击敌如割草。

两千多年后的2019年,一家叫阿里巴巴的公司,也造了一个叫含光的物品,不过它不是剑,是一款芯片。

含光芯片,对得起名字。

北京时间11月7日,MLPerf基准联盟,公布首轮AI推理基准测试结果:阿里巴巴平头哥的AI芯片含光800,在Resnet50基准测试中,获得单芯片第一。

MLPerf是什么?

MLPerf,是业内首套衡量机器学习软硬件性能的通用基准,由图灵奖得主大卫·帕特森(David Patterson)于2018年,联合谷歌和几所名校成立。

MLPerf基准联盟,现有50多家成员,包括谷歌、微软、Facebook、阿里巴巴等企业,以及斯坦福、哈佛、多伦多大学等高校。

继MLPerf AI训练基准v0.5、v0.6之后,MLPerf在2019年6月,推出AI推理基准v0.5。

而这次参加推理基准测试、并提交结果的公司共14家,谷歌(TPUv3)、英伟达(T4、RTX、Xavier)、英特尔(CLX 9282、NNPI-1000)、Habana(Goya)等均参与逐鹿。

单芯片第一,厉害在哪里?

一般来讲,MLPerf 推理基准测试,设有五个基准,每个基准对应四种场景,该测试重点面向图像分类、对象检测和机器翻译等常见的机器学习任务。

含光800,参加了适用于图像分类任务的Resnet50 v1.5基准测试,在离线模式(Offline mode)、服务模式(Server mode)、多路模式(Multi stream mode)和单路模式(Single stream mode)四个场景测试中,成绩都是单芯片第一。

离线模式:含光800超谷歌和英伟达

在芯片测试中,离线模式测试的目的,是评估芯片推理的最大吞吐量。

这项测试,可以体现芯片的基本功、考验计算、存储、通信的设计所能够达到的最佳性能。

在该项测试中,含光800的成绩是69306.60 image/sec,是第二名Google TPU v3的2.11倍。Google TPU v3.8用了4颗芯片,因此论单芯片性能,含光800是TPU v3的8.5倍。

服务模式:是第二名Google TPU v3的2.82倍

服务模式,主要用来测评芯片系统单张图片的吞吐量,含光800的成绩是45169.48 image/sec,是第二名Google TPU v3.8的2.82倍。

多路模式:是第二名的Habana Goya的3.84倍

多路模式,则是评估芯片系统所能支撑的视频流的最大路数。

这里的视频流,定义为20帧/sec。其主要应用于视频、监控、智慧城市等。

在多路模式测试中,含光800最大可同时处理2692路视频流,是第二名的Habana Goya的3.84倍。

单路模式:比第二名Habana的Goya快1.41倍

单路模式测试,是用于评估芯片系统的单张图片请求吞吐量。

它强调单图片的推理场景下,芯片的最小反应延迟,反应越快越“聪明”,数值越小越优秀。

这项测试中,含光800的成绩,是0.17毫秒。比第二名Habana的Goya快1.41倍。

中国公司首次提交的原创AI芯片

CSDN采访阿里巴巴资深专家、MLPerf专家组成员徐凌杰得知,含光800是中国公司首次提交结果到MLPerf的原创AI芯片。

这款芯片,有每位团队成员的倾情投入,也离不开阿里巴巴经济体强有力的组织保障和支持。

在未来,含光800将助力阿里巴巴AI业务的发展。此外,含光800本次的结果,也提交到了预演示大类。

这意味着,含光800的算力,将通过阿里云对外输出,阿里云的用户,将有机会在云上,使用含光芯片来加速AI应用。

那么,含光厉害在哪里?

2019年9月问世的含光800,是阿里巴巴第一款正式的流片芯片,它基于台积电12nm工艺生产,采用平头哥自研架构,可以有效降低内存访问延时,并集成达摩院的创新算法,可以深度优化CNN及视觉类算法,还可大幅提升视觉计算效率。

目前,含光800主要用于云端视觉场景,现已大规模应用于阿里巴巴集团内多个场景,如视频图像识别/分类/搜索、城市大脑等,未来还可应用于医疗影像、自动驾驶等领域。

“神看光是好的”

古老的西方经典《圣经》中,有这样一处记载:“神看光是好的,就把光暗分开了。”

国内互联网巨头中,敢做芯片的不多,因为不仅得有巨多的钱、还得有巨多的人才、更得有巨多的时间。

钱和人,阿里巴巴都不缺,很多公司也不缺。

但是,造芯片的速度,堪比光速。

说含光芯片,是国产芯片的一束光,并不为过。

这束光,足以揭开国产芯片的未来,也足以鼓励更多中国企业造芯片。

多年前,联想前总工程师倪光南,哪怕负债,也要造芯片。

直到中兴事件后,很多人开始夸他有先见之明。

含光的诞生,虽然并没有悲壮的色彩。

但是当国外科技大佬,总是在演讲中提起Alibaba和HUAWEI的名字时,像极了过去的我们:那些年,我们不也是动辄就谈微软和谷歌,动辄就觉得他们很牛掰嘛?

中国造,也可以很优秀。话说回来,我们只不过是恢复原来的地位而已。

四项第一!这款芯片让全世界嫉妒!相关推荐

  1. 五项挑战获四项第一,地平线霸榜Waymo自动驾驶算法挑战赛

    美国当地时间6月15日,Alphabet(Google母公司)旗下的自动驾驶公司Waymo在CVPR 2020自动驾驶Workshop上揭晓Waymo开放数据集挑战赛的结果,边缘AI芯片企业地平线斩获 ...

  2. 中国AI芯片公司霸榜谷歌Waymo自动驾驶算法挑战赛!五个赛道,四项冠军

    金磊 发自 凹非寺 量子位 报道 | 公众号 QbitAI 当今之世,最新证明自动驾驶实力的方法是什么? Waymo开放数据集挑战赛上一较高下,肯定是最具说服力的一种. 这不,作为全球自动驾驶公司王者 ...

  3. 编程语言-3-谷歌AAB以及华为HarmonyOS和openEuler和四款芯片

    参考华为轻量级操作系统 LiteOS 参考官方科普:一图读懂欧拉开源操作系统 1 谷歌dev blog原文 谷歌dev blog原文: Android App Bundle: Google Play ...

  4. ECCV 2018 | 旷视科技包揽COCO+Mapillary四项世界第一,中国公司成最大赢家

    2018 COCO+Mapillary 联合挑战赛颁奖现场 当地时间 9 月 8 日,两年一度.为期一周的欧洲计算机视觉顶级学术会议 ECCV 2018 在德国慕尼黑拉开帷幕.据官方信息显示,ECCV ...

  5. 默克与Palantir合作打造半导体制造数据平台Athinia;亚马逊云科技推出四项新存储服务和功能 | 全球TMT...

    海外市场 默克宣布与硅谷企业级大数据平台系统构建商Palantir Technologies Inc.达成一项新的合作关系并成立合资企业,双方将携手为全球半导体制造行业打造安全数据协作分析平台 -- ...

  6. UWB定位: 第四篇 . Apple Iphone11 U1芯片 Apple UWB专利

    UWB定位系列专题: UWB定位: 第一篇 . 简介 UWB定位: 第二篇 . 原理 UWB定位: 第三篇 . 市场分析 UWB定位: 第四篇 . Apple Iphone11 U1芯片 & ...

  7. 40天,编码器效率优化100倍,字节跳动这样拿下国际比赛4项第一

    如何看在线视频更省流量?近几年,人们观看各类视频越来越流畅了.背后除了网络基础设施的提升之外,一项"黑科技"起到了关键的作用:视频编码.这也是字节跳动技术团队研究的重要领域. 在视 ...

  8. MSU2021世界编码器大赛成绩公布,阿里自研编码器获六项第一

    10月30日,一年一度的MSU世界编码器大赛全高清(FullHD)客观性能赛道成绩公布,官方正式报告显示,继去年阿里自研S265取得两项PSNR指标第一名,阿里自研的VVC编码器S266首次亮相,就一 ...

  9. 2022双十一当贝投影战报:劈风斩浪,六项第一

    当贝是一家横跨软件.硬件和操作系统全生态的大屏端互联网平台型公司,在本次双十一战绩更是十分出色,获得六项第一,巩固高端家用第一名的宝座. 2022双十一当贝战报 当贝斩获激光投影仪销量&销售额 ...

最新文章

  1. ADO.NET 中的表达式
  2. 【翻译】安卓新播放器EXOplayer介绍
  3. 中国超细旦丝现状调研及投资前景评估报告2022-2028年版
  4. Fedora 11-Alpha试用手记
  5. 开源商务智能软件Pentaho
  6. js获取dom html元素属性,JS如何通过元素的CLASS属性得到对应的DOM对象?
  7. matlab+awgn和wgn,噪聲強度(噪聲功率) 噪聲方差到底有什么關系? matlab中的awgn函數...
  8. Spring框架中的控制反转和依赖注入
  9. ftp信息或服务器信息,服务器:FTP报错信息怎么办
  10. 机器翻译简史:八十多年来,人类就是要再造一座通天塔
  11. 胡伟武计算机体系结构2版pdf_最新重大版重庆高中英语必修模块1/2/3/4课文听力单词录音MP3音频+电子课本PDF+课件+教案+试题...
  12. 华为模拟器eNSP配置DHCP自动分配IP地址
  13. 解决关于Windows10连接共享出现“因为文件共享不安全,所以你不能连接到文件共享。此共享需要过时的SMB1协议”的问题
  14. 霍尔线序排列与电机运转的关系
  15. python bp神经网络的库_python bp神经网络库
  16. 云主机服务比价与预测系统开发心得--第一周(1)--git技术
  17. 浙大PTA-Python题库 编程题第五章(5-1~5-11)题解
  18. unique中译_unique是什么意思_unique的翻译_音标_读音_用法_例句_爱词霸在线词典
  19. xilinx fpga学习笔记5:Xst综合属性
  20. 用户体验为什么重要?如何提升产品的用户体验?(写给产品小白)...

热门文章

  1. 真是蛋疼,cvet网测
  2. 尝鲜之在Github上搭建Octopress博客
  3. Linux下cat 命令
  4. nginx 405 not allowed问题解决方法
  5. spark 运行自带python示例的方式
  6. leetcode 859 亲密字符串
  7. html.fromhtml 加载图片,TextView使用html.fromhtml加载html并显示图片
  8. 项目解析jsx文件_仅含一个源文件:这5个开源项目值得一看
  9. 记录——《C Primer Plus (第五版)》第八章编程练习第五题
  10. 电力电容器行业调研报告 - 市场现状分析与发展前景预测(2021-2027年)