作者 | 夕颜、胡巍巍

编辑 | 唐小引

出品 | AI 科技大本营(ID:rgznai100)

9 月末的杭州气温适宜,宜出游,宜在湖边餐厅浅酌一杯清茶消闲。但在钱塘江水支流河畔的云栖小镇,却完全一副与闲适氛围不相称的热闹景象。

因为今天阿里巴巴一年一度的云栖大会在这里正式开幕,早上 8 点钟不到,会场外早已人头攒动。杭州市人民政府副市长柯吉欣表示,今年云栖大会的参会嘉宾超过八万人。

进入主会场后,格子衬衫成了会前一道亮丽的风景线。

乐队激情开唱,为大会助阵。

开幕式和精彩的“前菜”过后,2019年云栖大会正式拉开帷幕,阿里巴巴集团首席技术官兼阿里云智能总裁、达摩院院长张建锋紧接着逍遥子之后发表了题为《构建数字经济基础设施》的演讲。

张建锋,花名行癫,2004 年加入淘宝,担任首席架构师,此后一直在淘宝工作,阿里巴巴集团合伙人之一。现任阿里巴巴集团首席技术官(CTO)兼任阿里云事业群首席技术官(CTO)、中台事业群总裁、集团技术战略执行小组组长,2018 年 11 月 26 日阿里组织架构调整之后,张建锋兼任阿里云智能事业群总裁,向阿里巴巴集团 CEO 张勇汇报。

以下为演讲亮点提炼:

平头哥出新!全球最高性能 AI 推理芯片含光800发布

会上,张建锋宣布了阿里巴巴平头哥重磅发布:AI 推理芯片含光 800,在 AI 场景中对异构计算做了补充。

             

“含光”一出,便在现场引起了热烈的掌声,张建锋介绍道,在业界标准的 ResNet-50测试中,含光 800 推理性能达到 78563 IPS,比目前业界最好的 AI 芯片性能高 4 倍;能效比 500 IPS/W,是第二名的 3.3倍。

张建锋说:“在全球芯片领域,阿里巴巴是一个新人,玄铁和含光 800 是平头哥的万里长征第一步,我们还有很长的路要走。”

含光其名,源自上古三大神剑之一「含光剑」,该剑含而不露,光而不耀,正如含光 800 带来的无形却强劲的算力。在杭州城市大脑的业务测试中,1 颗含光 800 的算力相当于 10 颗 GPU。

据阿里官方介绍,含光 800 性能的突破得益于软硬件的协同创新:硬件层面采用创新低自研芯片架构,针对深度学习中使用的大量权重参数和张量数据,在支持稀疏压缩与量化处理的基础上,通过独特设计的数据访存与流水线处理技术,大大减低了 I/O 需求和数据的搬移,NPU 同时深度优化了卷积、矩阵乘、向量计算和各种激活函数,通过高有效的硬件资源调度和全并行的数据流处理,有效解决芯片性能瓶颈问题;软件层面集成了达摩院先进算法,针对 CNN 及视觉类算法深度优化计算、存储密度,可实现大网络模型在一颗 NPU 上完成计算。此外,它还拥有自动化开发工具,支持 TensorFlow、Caffe 等主流开源框架,还可进行多模型动态部署。

含光 800 已开始应用在阿里巴巴内部核心业务中。根据云栖大会的现场演示,在城市大脑中实时处理杭州主城区交通视频,需要 40 颗传统GPU,延时为 300ms,使用含光 800 仅需 4 颗,延时降至 150 ms。拍立淘商品库每天新增 10 亿商品图片,使用传统 GPU 算力识别需要 1 小时,使用含光 800 后可缩减至 5 分钟。

此外,含光 800 将通过阿里云对外输出 AI 算力。基于含光 800 的 AI 云服务也在今天正式上线,相比传统 GPU 算力,性价比提升 100%,对于受限于算力瓶颈的企业而言,含光 800 可以更高效地运行更复杂、更先进的算法。

过去一年,平头哥团队在不断探索芯片与场景的融合,如对算力需求较大的图像视频分析、搜索、推荐等业务场景。围绕这一目标,平头哥针对场景深度定制了芯片的软硬件,例如自研了架构、软件编译器、框架、工具链等,如先后发布的玄铁 910、无剑 SoC 平台,后期也针对 INT8数据类型做了大量优化。

张建锋表示,端云一体芯片是平头哥的主要方向,终端玄铁处理器可以与云端含光 800芯片协同。

平头哥模式:端云一体芯片生态为各行业提供普惠算力

一年前,阿里宣布要自研芯片,短短一年时间之内,含光 800 即问世,且芯片的设计、流片整过程极短,据悉,平头哥团队 7 个月就完成了含光 800 的前端设计,之后仅用了 3 个月就成功流片。

出手快准狠,阿里平头哥做芯片的决心和能力都不容小觑。

和绝大多数芯片商不同的是,平头哥的目的并非卖芯片,而是开辟了全新的商业模式(平头哥模式),致力于为企业提供普惠算力。

随着含光 800 的发布,平头哥端云一体全栈产品系列初步成型,涵盖处理器IP、一站式芯片设计平台和 AI 芯片,实现了芯片设计链路的全覆盖。

平头哥团队表示,AIoT 场景需要新的计算架构,需要安全、在线和智能等新的特性,所有芯片面临升级,这必将在芯片行业将引起一波全新技术革命和产业浪潮。但 AIoT 市场有强应用驱动和场景碎片化等特点,芯片公司按照传统的方式设计芯片很难适应未来的需求,平头哥希望通过端云一体芯片生态为各行业提供普惠算力。

未来,平头哥的产品形态还会进一步完善,例如推出云上 AI 训练芯片和端上 AI 推理芯片,目前平头哥还在研发用于阿里云神龙服务器的 SoC 专用芯片,以满足更多场景的算力需求。

数字化经济四大关键技术

除了这一重磅发布之外,张建锋在演讲中还介绍了阿里巴巴在数字化建设中所做的工作和成果。

阿里巴巴的核心使命之一就是构建数字经济基础设施。张建锋说道,在数据大爆炸的时代,数据成为核心资源,数据相当于农业社会的石油,算力相当于工业时代的发电机。如今,数字经济发展迅速,全球数据呈增张趋势,若干年后将达到 175 ZB 的规模。数据显示,2018 年,数据对我国 GDP 增长的贡献率达 67.9%,连续 5 年贡献率超过 50%。没有数字化对经济的影响,相当于没有计算机对信息化的影响。

他认为,数字经济驱动着经济变革,全要素数字化升级成为数字经济发展的新动能,从需求到生产,从供应到消费,数据成为数字经济发展强有力的驱动力。

他还指出,现代信息技术在驱动数字化转型的进程中发挥着核心作用,是数字经济的基础。他将数字化经济需要的技术总结为四大关键点:可靠易用的云、全局智能的大数据、云端一体的智联网和随时随地的移动协同。

从去年开始,阿里云升级为阿里云智能,云第一次把 IT 技术从端到端的设施集成到云端,完成了一次变革,让企业和个人可从云端获得稳定、便捷、低成本、可靠的算力。

其中,可靠易用的云是数字经济的基础设施。对于企业来说,上云是一号位战略决策,一定要从技术理念变革和顶层设计层面推动。

另外,大数据深刻地改变了很多应用,张建锋认为,云与大数据之间有着紧密的联系。有了云,我们可以处理大规模的数据,但两者的结合才是构建数字化的基础。全局智能的大数据技术的全链路处理让数据产生价值,“让数据多跑路”可以让数据集中发挥最大效能,比如浙江省把 92 个部门数据打通之后向数据要智能,累积为 2000 万市民提供服务。

拥有云端一体的智联网在数字化过程中也十分关键。实现一切设备的在线化、实时化是阿里巴巴的目标,为用户提供云端组件、实时化产品和服务,这是智联网的核心。

随后,张建锋还以钉钉为例讲解了随时随地移动协同的重要性。他说道,目前钉钉上已有 1000万以上组织在该平台上实现了在线移动协同,移动化也从消费域进入生产域,移动协同成为数字化经济的一个核心基础设施。

含光 800 的发布使得阿里平头哥端云一体全栈产品系列初步成型,助力阿里在数字经济基础设施构建中“再下一城”。未来,阿里端云一体的芯片生态能在全球芯片技术升级和产业浪潮中走多远,我们拭目以待。

(*本文为AI科技大本营原创文章,转载请微信联系1092722531)

精彩推荐

2019 中国大数据技术大会(BDTC)历经十一载,再度火热来袭!豪华主席阵容及百位技术专家齐聚,15 场精选专题技术和行业论坛,超强干货+技术剖析+行业实践立体解读,深入解析热门技术在行业中的实践落地。【早鸟票】与【特惠学生票】限时抢购,扫码了解详情!

“含光”剑出,谁与争锋?阿里重磅发布首颗AI芯片含光800相关推荐

  1. “倚天”一出,谁与争锋?阿里发布首颗云芯片倚天 710,死磕自研芯

    作者 | 贾凯强.伍杏玲 出品 | CSDN 10 月 19 日,2021 年云栖大会正式拉开帷幕.达摩院院长.阿里云智能事业部总裁张建锋表示,如今一个以云为核心的新型计算体系结构正在形成,该体系从三 ...

  2. 寒武纪重磅发布首款AI云芯片,陈天石要让端云结合占领10亿智能终端!

    今天,寒武纪科技放出两个重磅"炸弹": 寒武纪最新一代终端IP产品-Cambricon 1M 寒武纪最新一代云端AI芯片MLU100和板卡产品 寒武纪创始人陈天石介绍,这次最新发布 ...

  3. 阿里第一颗芯片问世,平头哥发布最强AI芯片含光800

    阿里巴巴第一颗自研芯片正式问世.9月25日的杭州云栖大会上,达摩院院长张建锋现场展示了这款全球最强的AI芯片--含光800.在业界标准的ResNet-50测试中,含光800推理性能达到78563 IP ...

  4. 焦点分析 | 平头哥的首颗 AI 芯片对阿里云来说意味着什么?

    文 | 王毓婵 编辑 | 苏建勋 "去年四五月份,阿里内部设立做芯片的目标并开始做 PR 的时候,我们实际上一行代码都还没写,压力非常大."谈及阿里首款 AI 芯片的诞生,阿里巴巴 ...

  5. MLPerf发布首个AI芯片推理测试排行榜:阿里平头哥含光800获得多项第一

    晓查 发自 凹非寺  量子位 编译 | 公众号 QbitAI 今天MLPerf基准联盟公布了第一批AI芯片的推理测试结果,对来自19个公司机构的594种芯片在各种自然语言和计算机视觉任务中的表现进行了 ...

  6. ChatGPT 不是终点:阿里不出,谁与争锋?

    ChatGPT正在变成一场竞赛,中国企业争先恐后抢发"自研"的ChatGPT,争当所谓的赢家.但实际上,ChatGPT并非竞赛的终点,而是起点,只是堪堪拉开了人工智能新时代的一角序 ...

  7. 「倚天」一出,谁与争锋!全球首款5nm服务器芯片,业界最强

    来源:机器之心 目前业界性能最强的 ARM 服务器芯片,性能超过业界标杆 20%,能效比提升 50% 以上. 10 月 18 日是 2021 云栖大会的开放日,在 40000 平米的展区中,有一个展位 ...

  8. 香港金融中心谁与争锋

    2012年08月02日 06:42 AM 香港金融中心谁与争锋 英国<金融时报> 保罗•戴维斯 字号 背景 英文对照评论打印电邮收藏腾讯微博新浪微博 杨婕(Joy Yang)算不上一个真正 ...

  9. sohu邮箱,谁与争锋!

    打小就没用过sohu的任何服务,三大门户里就喜欢网易,sina和sohu都是一年半年不上一次的.10月份的时候搞i桌面 玩,试了试注册了 [cnlidc#163.com]     [cnlidc#si ...

最新文章

  1. php mysql-proxy报错_MySQL-proxy代理导致PHP PDO::ATTR_EMULATE_PREPARES的预处理出错,MySQL报General error: 1243错误...
  2. 2篇word文档比较重复率_论文深耕 | 论文重复率太高怎么办?7个降重技巧收好了!...
  3. 【python爬虫】报错module requests has no attribute get
  4. (转)基于MVC4+EasyUI的Web开发框架形成之旅--MVC控制器的设计
  5. springboot+JPARepository实现增删改查
  6. 投毒、伪装、攻击,DNS 欺骗和钓鱼网站如何一步步诱人掉入陷阱?
  7. css 这个特性,你敢信
  8. java 解压ygb文件_文件系统-目录项缓存与散列表
  9. SQLPLUS登陆命令
  10. IMU惯性测量单元是什么?
  11. excel随机数_利用excel快速凭空制造大量随机数据?想要制造什么数据都可以
  12. 计算机热启动方法,关于电脑热启动的介绍
  13. 图像处理:语义分割(sematic segmentation)
  14. NoteExpress
  15. 背包问题(Knapsack Problem)—— 0/1 背包问题 —— 总价值最大问题
  16. swift WkWebView的返回,goback,跳过同级
  17. 领导对你说这3句“小话”,表面关心,实则敲打,不改将被弃用
  18. Fiddler Response中Raw显示乱码的解决方式
  19. Eclipse+Maven配置TestNG框架
  20. 上海高校计算机等级考试c语言真题,2017年上海市高等学校计算机等级考试试题「有答案」...

热门文章

  1. [AWK]使用AWK进行分割字符串以及截取字符串
  2. JDBC实例--工具类升级,使用Apache DBCP连接池重构DBUtility,让连接数据库更有效,更安全...
  3. 下载Ext JS 5.1 gpl版本的方法
  4. 从1.5K到18K 一个程序员的5年成长之路(二)
  5. 浅析flex中的焦点focus
  6. 回到未来 – 大胆畅想如何追赶并超越腾讯模式
  7. 2018-4-8蚁群算法---包子阳《智能优化算法以及Matlab实现》第五章
  8. 数值分析第一次作业-牛顿迭代法求解二元非线性方程组
  9. 面向对象(类的概念,属性,方法,属性的声明,面向对象编程思维
  10. ping命令使用及其常用参数