来源:新智元

【导读】从深度学习算法、计算机视觉算法到AIoT算法,从开源框架旷视天元到AI生产力平台Brain++,旷视十年故事,旷视首席科学家、旷视研究院院长孙剑讲给你听。

万万没想到,我和小伙伴们被旷厂拿去「炼丹」了。

没错,就是这个炼丹炉!

站在炉子中央,各种算法代码眼前飞闪,让我体验了一把时空穿梭的快乐。

‍OMG!真·颅内高潮...

业界认为「炼丹」过程正如算法研究过程。

众所周知,AI的三大支柱分别是数据、算法、算力。

那么在炼丹过程中,数据便是金木水火土等自然元素,算法框架是用来炼丹的炉子,算力就是炼丹炉下的三昧真火。

元素全不全,炉子好不好,火旺不旺决定了AI开发者能不能练出一颗AI的「灵丹妙药」。

从2014年至今,中国新一代炼丹宗师旷视经过多年的磨练打磨,打造了「炼丹房」—— Brain++。

MegEngine(深度学习框架天元)是丹炉,MegData(数据管理平台)是元素,MegCompute(深度学习云计算平台)便是那三昧真火。

这次,「炼丹房」 Brain++ 迎来了全新升级!

升级后的炼丹房,「自动」成为最大特色,炼丹师们不再需要经过九九八十一天这么漫长的时间来炼制丹药。

这个平台提供了怎样的最新功能,让AI开发者们更轻便地生产算法?

Brain++「神助攻」:一个「旗帜检测」算法诞生

熟悉旷视的人都应该知道,Brain++ 是旷视在AI领域创业多年的致胜法宝。

它将算法、算力和数据能力集为一体,核心能力包括:

数据的处理、清洗和管理能力,算力的共享、调度和分布式能力,算法的训练、推理及部署能力。

全面覆盖了从 AI 生产(输出算法模型)到应用(实现算法工程化封装)各环节。

因此,Brain++被内部定义为「AI生产力平台」。

但时局变了,数据满溢,算力飞升,算法无处不在。许多开发者们真正面临的挑战是:如何让算法生产更加高效?

要知道,算法生产能力决定算法价值上限。

当前的算法生产不仅仅是模型的训练,还包括需求分析、数据处理、上线部署、落地应用4个环节。

过程标准化是影响算法生产的关键要素,只有过程标准化才能实现算法生产的自动化。

让算法生产迈向自动化时代,便是Brain++迎接这一挑战的底气!

自动化的数据管理和质检——自动推荐合适的训练算法和模型——自动检查算法准确率并给出优化建议便是升级后Brain++的最新功能。

举个真实场景中的例子,

在钢铁冶炼厂中,存在一些比较危险的设备。根据生产安全的要求,这些设备周围需要插小红旗来做警示和标志。

如何能够检测出小红旗是否还插着?

这就需要做一个红旗检测的模型,通过安装的摄像头来进行自动化检查。

需求明确后就需要进行算法生产了。

首先,Brain++提供自动化的数据管理和质检,包含十余种质检策略,这个过程中可以排除无意义的数据。

下面这2个红旗就是通过自动化平台所发现,图片的画风其实和我们真实场景中的差别非常大,就属于一些无效数据,或者说噪音数据。

平台自动检测出后,就会在训练模型前帮你剔除。

然后便开始模型自动化训练,平台会根据部署资源的要求,为开发者自动推荐最合适的训练算法和策略。

这一环节中,就不需要开发者自己去学习到底应该怎样去选择算法或者调优模型。

接下来便是算法调优分析,Brain++集成十余大类不同的结果分析和对应的调优策略,比如漏检/误检结果呈现。

当红旗检测模型训练完成后,将其放到实际应用场景中测试,黄色框就是一次训练后的算法检测出来红旗的位置。

说明这一算法存在明显误检问题,特别可能在这样的一个场景误检率比较高,AI生产力平台便可帮助开发者自动发现问题,并给出针对性优化建议。

总的来看,当我们分析完想要做一个旗帜的检测需求之后,首先需要2个小时来做一个图像的质检和旗帜的标注,之后选择一个GPU的训练环境,模型训练的时间大概花费一个小时左右的时间。

在上线部署后,根据刚刚提到的分析和调优策略,研究人员进行了2轮左右的迭代,一个「旗帜检测」算法就诞生了!

你所感受到的便捷,是旷视通过总结过去10年算法生产落地的海量经验,探索出一套「快速、低成本生产算法」的模式,并将其沉淀在Brain++。

这十年,旷视AI创新走过怎样一个历程?

7月16日,由旷视首席科学家、研究院院长孙剑领衔的技术团队在2021旷视技术开放日(MegTech 2021)上分享了旷视十年来在AI技术上的实践和思考。

十年实践,首席科学家孙剑发AI「灵魂」三问

今年,是旷视成立的第十年。

我们来聊一聊旷视这十年的进阶之路。

首席科学家孙剑以旷视为例,总结了过去十年中国AI技术价值的发展历程。

2011年前后,AI发展的重点是基础科研。基础科研的关键点是突破单点算法,让AI率先在互联网等数字化程度高等领域应用落地,变得真正可用。

2015年起,AI需求越来越多,AI商业化落地也越来越多。这个过程中,算法在不断拓展应用的边界,从算法到软硬结合,AI创造的价值越来越大。

从2020年开始,AI成为新基建的重要部分,持续降低算法门槛,让AI生产变得更加容易,基础设施需要AI普惠化。

AI有没有用?AI在哪里用?AI易不易用?

这是AI行业的「灵魂」三问,是所有AI企业需要回答的问题。

孙剑认为,AI有没有用归根到底是看AI基础科研有没有突破。

基础科研是AI创新突破的基石,需要长期主义的坚持。

对旷视来说,要构建科学价值和产业价值统一的基础科研体系。

十年来,旷视不断突破创新:

在学术上发表85篇顶级会议论文,在竞赛上斩获40项冠军,在实用上研发了包括ShuffleNets系列在内的众多基础模型,已经广泛应用在手机等智能设备上,推动软硬协同发展。

基础科研有了,落地才是科研的价值,这就需要解决「AI在哪里用」的问题。

对于旷视,一直瞄准的是消费物联网、城市物联网和供应链物联网三大场景。

AI是核心能力,IoT是落地场景,在数字世界与物理世界融合的智能化时代,AI算法正在为产品带来更多的价值提升。

旷视认为,「算法不只让很多产品从好变更好,更能让产品从不可能变可能。」

在旷视十年的AI实践落地中发现,算法已不再仅仅是「软件物料」,而是成为「核心组件」。

从科研到落地,算法正在创造越来越大的价值,也在开始重新定义软硬件。

旷视研究员范浩强在MegTech 2021上的分享

AI落地是我们所有人都在讲的问题,但是当前,大量算法生产过程还是非标准化。因为非标准化所以算法生产过程充满不确定性。

旷视认为,落地实用是检验算法的最高标准之一,而生产落地实用算法的过程「只有先标准化才能自动化」,才能更进一步实现规模化的普惠易用。

从2014年至今,持续打磨升级的AI生产力平台Brain++,就是旷视推动算法生产迈向自动化时代的AI基础设施。

为什么是旷视?

不是炼丹「上瘾」,是AI进化

旷视是一家靠算法起家的公司。

准确来说,可以细分为两类:

一类是以深度学习(DL)和计算机视觉(CV)为基础的核心算法。

另一类则是行业算法 (或者称AIoT算法)。

旷视的算法之路,经历了从核心算法突破,到行业算法落地和创新,再到算法生产平台的拓展过程。

MegTech 2021上,旷视展示了其算法量产星空图。

算法量产不是一个单一产品,更不是「上瘾」,而是一种生产模式的理念革新和生产力进化。

旷视现场通过一系列技术Demo演示,系统展示了其最新的技术成果。

旷视研究院推出了面向服务器和下一代AI芯片的通用模型RepVGG,其在开源后Github star已超过1800。

还推出全景视频实时拼接算法。

全景视频拼接的实现,需要多个摄像头在同一场景下采集不同方向视频,然后逐帧地将各个方向的视频帧拼接起来,最终得到360度全景视频,甚至360度*180度的球面全景视频。

其核心是运用基于光流的多摄AI拼接算法,同时依靠实时动态无缝拼接网络模型,解决了多摄拼接计算量大、拼缝明显,以及拼接无法动态更新的技术难题。

还有单目3D车路感知:仅用单目可见光相机,就可以实现车路信息的3D感知。

旷视MegTech 2021上还展示了,目前性能最强的端到端实时全卷积全景分割算法,以及挑战经典,目标检测架构创新的YOLOF。

从基础科研,到行业落地,再到基础设施,这是人工智能技术价值跃迁的三个关键。

旷视正是沿着这样的路线在不断创新,务实落地。预研一代、孵化一代、交付一代,这是旷视技术创新研发模式。

在技术开放日现场,旷视将这一套创新研发模式首次对外完整的呈现出来。

孙剑总结道,「聚焦最优秀的人才,一起做最好的科研,通过产品让科研成果创造价值,不断探索新领域,这是旷视的秘诀,也是AI技术价值跃迁的秘诀。」

对了,忘了告诉你,这是一个北京新晋AI网红打卡圣地。

不要太燃~

推荐阅读

  • 【重磅】斯坦福李飞飞《注意力与Transformer》总结,84页ppt开放下载!

  • 分层级联Transformer!苏黎世联邦提出TransCNN: 显著降低了计算/空间复杂度!

  • 清华姚班教师劝退文:读博,你真的想好了吗?

  • 2021李宏毅老师最新40节机器学习课程!附课件+视频资料

  • 最强通道注意力来啦!金字塔分割注意力模块,即插即用,效果显著,已开源!

  • 登上更高峰!颜水成、程明明团队开源ViP,引入三维信息编码机制,无需卷积与注意力

  • 常用 Normalization 方法的总结与思考:BN、LN、IN、GN

  • 注意力可以使MLP完全替代CNN吗? 未来有哪些研究方向?

  • 清华鲁继文团队提出DynamicViT:一种高效的动态稀疏化Token的ViT

  • 并非所有图像都值16x16个词--- 清华&华为提出一种自适应序列长度的动态ViT

重磅!DLer-计算机视觉&Transformer群已成立!

大家好,这是计算机视觉&Transformer论文分享群里,群里会第一时间发布最新的Transformer前沿论文解读及交流分享会,主要设计方向有:图像分类、Transformer、目标检测、目标跟踪、点云与语义分割、GAN、超分辨率、视频超分、人脸检测与识别、动作行为与时空运动、模型压缩和量化剪枝、迁移学习、人体姿态估计等内容。

进群请备注:研究方向+学校/公司+昵称(如Transformer+上交+小明)

???? 长按识别,邀请您进群!

旷视AI「炼丹房」Brain++ 再升级!首席科学家孙剑发AI「灵魂」三问相关推荐

  1. 旷视AI「炼丹房」Brain++ 再升级 首席科学家孙剑发AI「灵魂」三问

    万万没想到,我和小伙伴们被旷厂拿去「炼丹」了. 没错,就是这个炼丹炉! 站在炉子中央,各种算法代码眼前飞闪,让我体验了一把时空穿梭的快乐. OMG!真·颅内高潮... 业界认为「炼丹」过程正如算法研究 ...

  2. 旷视首席科学家孙剑:深度学习变革视觉计算

    https://www.toutiao.com/i6714941914564526596/ 孙剑从视觉智能.计算机摄影学以及AI计算3个方面介绍了计算机视觉研究领域的变革. 作者 | 张栋 AI科技评 ...

  3. 旷视首席科学家孙剑因突发疾病抢救无效去世:天妒英才

    雷递网 乐天 6月14日报道 旷视今日发布讣告,称万分难过,旷视首席科学家.旷视研究院院长孙剑博士因突发疾病抢救无效,于2022年6月14日凌晨去世,年45岁. "孙剑博士一生专注于科研工作 ...

  4. 哀悼!旷视首席科学家孙剑博士突然离世,终年45岁

  5. AI当自强:独家揭秘旷视自研人工智能算法平台Brain++

    随着深度学习逐渐从实验室走向工业应用,各大企业都在探索构建算法架构.实现模型的工具和平台.和使用 TensorFlow 或 PyTorch 等开源框架的公司不同,旷视走向了一条自主研制的道路,建立了从 ...

  6. Amazon 首席科学家李沐亲授「深度学习」,2019 AI ProCon震撼来袭!(日程出炉)...

    2019年9月5-7日,面向AI技术人的年度盛会-- 2019 AI开发者大会 AI ProCon,火热来袭!  继2018 年由CSDN成功举办AI 开发者大会一年之后,全球AI市场正发生着巨大的变 ...

  7. 10万奖金!探索图像盲降噪新方式,旷视2022 MegCup炼丹大赛等你来战

    关注"旷视研究院"公众号 获取比赛最新详情吧!

  8. 「我是为“数据”去的京东」对话京东供应链首席科学家申作军

    2019年11月20日,京东零售集团智能供应链Y业务管理部供应链开放日,美国加州大学伯克利分校工业工程系主任,京东供应链首席科学家,申作军教授做了题为<大数据驱动的自动补货系统研究>的公开 ...

  9. 360金融新任首席科学家:别指望AI Lab做成中台

    「AI 技术生态论」 人物访谈栏目是 CSDN 发起的百万人学 AI 倡议下的重要组成部分.通过对 AI 生态顶级大咖.创业者.行业 KOL 的访谈,反映其对于行业的思考.未来趋势判断.技术实践,以及 ...

最新文章

  1. SCImago Journal Rank:微生物领域期刊综合评价指标排名
  2. VS生成时复制文件到指定目录
  3. c语言case后面多字符,多SWITCH-CASE结构时的C语言对象方式化解
  4. Android获取手机及外设存储空间
  5. 物联网卡linux,Server Develop (六) Linux epoll总结
  6. Python3 From Zero——{最初的意识:007~函数}
  7. leetcode54. 螺旋矩阵(详解)
  8. 如何开发高度可定制的产品
  9. 使用C#調用外部程式或是執行DOS命令
  10. 【Java】异常处理的目的
  11. leetcode 102 C++AC
  12. 预防死锁可以破坏哪些死锁的必要条件
  13. linux arm9视频哪个好,谈谈ARM7与ARM9的区别
  14. 理解CapsuleNetwork2
  15. 【深入浅出通信原理-学习笔记】通信系统概述
  16. html创建qq注册页面,用javascript制作qq注册动态页面
  17. Excel度分秒转度--公式大解析
  18. CANFD和CAN的区别简介
  19. 4 大话“奇异值”矩阵
  20. C# CS客户端不显示垂直滚动条

热门文章

  1. lvs(+keepalived)、haproxy(+heartbeat)、nginx 负载均衡的比较分析
  2. 第一回写的用arraylist模拟栈操作
  3. Oracle 存储过程之通用分页查询
  4. A. Case of the Zeros and Ones
  5. MVVM设计模式之精髓简化
  6. python客户价值分析_Python数据分析与应用航空公司客户价值分析.ppt
  7. java的游戏图片怎么加载_java游戏图像加载速度非常慢
  8. python获取文件路径
  9. java虚拟机参数-X 与 -XX的区别
  10. sklearn决策树模型机器学习参数解释很详细中文