允中 发自 凹非寺
量子位 编辑 | 公众号 QbitAI

近日,在杭州举办的2021全球人工智能技术大会上,腾讯优图联合厦门大学正式发布了《2021十大人工智能趋势》(以下简称“趋势报告”),基于双方长期对人工智能尤其是计算机视觉的研究洞察,对3D视觉技术、数字内容产业、AI深度学习算法、AI内核芯片等方向进行了分析预测。

趋势报告显示,人工智能技术向安全智能方向持续演化,有望最终实现人工智能可用性与可信性双轨并重的现实需求,推动人工智能技术在更广泛领域的安全落地;隐私保护AI落地实用帮助算法可持续进化,算法公平性研究推动AI应用走向普惠无偏见、人工智能内核芯片向类脑神经计算方向演进、多模态融合加速AI认知升维等众多新趋势。

以下为趋势报告详细内容:

1、自动机器学习的自动化程度与可解释性得到进一步提升

自动机器学习(AutoML)目前已经在多个领域中初步实现对机器学习方法的自动化设计过程,但其仍然存在自动化程度不足,可解释性不强的问题。如神经网络结构搜索(NAS)在一些应用领域中取得了可以与人类机器学习专家可比较的水平,然而现有的NAS方法实际需要基于人工设计的神经网络基础结构。此外,AutoML的自动化过程往往被认为是一种 “黑箱”,缺乏可解释性。

今后自动化程度及可解释性仍然是AutoML研究的热点问题,通过提高AutoML中的超参数选择,特征表示与机器学习算法的确定和神经网络结构搜索的自动化程度及可解释性,AutoML将实现对机器学习涉及的每个环节的真正的自动化设计过程。AutoML整个体系架构的日趋完善,将推动新一代普适性AutoML平台的建设,并实现机器学习的大众化。

2、无监督/弱监督学习逐渐成为企业降本增效新利器

在过去的几年中,深度学习所取得的巨大成功离不开大规模标注的数据集。大规模标注的背后,是传统的监督学习对于每一个训练样本完备标签的要求。随着业务规模的不断扩大,越来越多的企业发现数据的标注开始成为抬高交付成本、制约效果提升的主要因素之一。

在此背景下,无监督学习和弱监督学习通过不使用标签或减少对标签数量、质量的要求来迅速降低深度模型对于数据的标注需求,使得原本无法利用的数据如今都可以加入到模型的训练中去,进而由量变引发质变。

在NLP领域,基于Transformer的无监督训练模型已持续霸榜各种NLP任务数据集;在CV领域,最新的MPL方法也通过额外的无标注数据集首次将ImageNet的Top-1分类准确率提升到了90%+的水平。

可以预见的是,将有越来越多的人工智能企业会面临从前期的迅速扩张到稳定期高效化运作的新阶段,而在这个过程中,无监督/弱监督学习无疑将成为他们过渡到这个阶段的重要手段之一。

3、3D视觉技术助力产业消费升级,淡化虚实边界

作为视觉AI领域多年热点研究方向之一,3D视觉技术的核心任务是对三维空间、物体及环境进行真实还原与重建。随着相关算法与硬件计算能力的不断升级, 3D视觉算法效果得到大幅提升,三维几何重建更加精细,表面纹理重建更加清晰,带来更加逼真的视觉观感。

近年来,诸多3D视觉研究成果为低成本高质量的3D内容生成提供了良好技术支撑,基于3D虚拟形象的舞台演出、直播带货、教育互动等应用层出不穷,成为AI内容产业全新发展方向。以此为基础,结合5G时代流量带宽的全面升级,带有交互功能的3D虚拟现实、增强现实、混合现实的3D视觉应用将用户体验向真实与虚拟的完美融合进一步迈进。

用户会因为虚拟偶像生动自然的舞台表演进行打赏,会由于虚拟主播“卖力”地带货促销而下单购买,而线上平台则依靠3D视觉技术大大降低内容制作和IP运营成本,最终带来社会商业发展模式与个人消费习惯的颠覆与变革。

展望未来,3D视觉技术将持续在包括游戏娱乐、影视制作、电商直播、医疗整形等众多领域广泛应用,虚拟与现实的边界将不断淡化。

4、多模态融合加速AI认知升维

深度学习在多个人工智能的细分领域(如视觉,自然语言处理等)已日趋成熟化和规模化,然而要真正实现通用人工智能,必然要将这些细分领域各自所针对的信息模态整合利用,即多模态融合

多模态融合的目标是建立在图像、文字、语音等的多模态信息识别的基础上,实现不同模态信息的统一表征框架,从而起到1+1>2的作用。典型的场景之一是通过图文语音联合识别,实现对隐晦和暗示性,招嫖广告,儿童不良表情包等图文混合内容识别,支持审核业务深度打击不良内容。

除了图文融合等跨域模态融合,同域内的不同信息维度同样可以融合,如随着深度生成技术的发展,当前的人脸识别除了传统的RGB图外,还需要融合深度图、红外图等信息来更好的防御越来越多元化的人脸伪造攻击,实现更强的人脸防御。随着人工智能认知能力的提升,多模态融合也将会从图文等实质性模态,逐渐拓展到如物理关系,逻辑推断,因果分析等知识性模态,从感知智能迈向认知智能。

5、人工智能推动数字内容生成向新范式演进

随着数字文化产业的蓬勃发展,尤其是二次元文化渗透出圈,数字内容产业面临新一轮的需求升级,伴随着5G商业化进程的不断加深,多元化、精品化的优质数字内容将面临更快的消费节奏,与此同时,供给侧仍存在巨大的产能缺口,数字内容产业正处于劳动密集型向科技密集型的转型阶段。

AI与数字内容产业的深度耦合,将有希望为行业释放更大的科技势能,以GPT-3、DALL-E为代表的AI技术,已在文本、语音、图像、视频等内容生成中取得了令人惊艳的结果,然而在精确性、泛化性、合理性方面仍然面临挑战,目前的前沿研究一方面探索从模型结构(自动化搜索等),训练形式(无监督对比学习等)等方面提升精度效果;另一方面引入知识图谱领域知识,向机器介绍常识和其他特定领域的知识进而提升常识推理效果。

伴随着技术的持续升级演进,我们预见AI将逐步在数字内容生成领域释放引擎级的影响力,在内容、平台、技术多方合力引导下,构筑数字内容生成新范式。

6、边缘计算与人工智能加速融合

近年来,随着深度学习算法的迅猛发展,计算机视觉、自然语言处理、搜索推荐广告等各种领域的任务性能得到不断刷新。同时,随着边缘智能设备的广泛普及和硬件改进,基于深度学习的人工智能技术在边缘端应用落地成为了可能。

然而,在边缘端上部署深度学习模型具有很大的难度。其主要挑战表现在,边缘端等智能设备在计算、存储、功耗等方面有很大的限制。

因此,边缘端模型必须满足低计算复杂度、小模型尺寸、低模型功耗等要求。未来将趋向硬件友好型的剪枝加速。根据边缘硬件的CPU类型来设计特定的网络稀疏化模式,适配不同硬件的模型压缩与优化加速技术是未来研究热点趋势。其次,基于自动化的1-bit量化方法有上百倍的理论性能提升,因此也是未来研究热点趋势。

7、人工智能内核芯片向类脑神经计算方向演进

人工智能内核芯片已经成为人工智能时代的关键技术之一,在某些领域中的具体任务上人工智能内核芯片能够实现超越人脑的表现,但针对人工智能内核芯片的研究依然落后于人工智能的发展,人工智能内核芯片无法同时满足多种人工智能算法的加速要求,并且面对各种新型人工智能技术不断涌现的局面,人工智能内核芯片与人脑相比其自我学习能力与可扩展性存在明显不足。

未来人工智能内核芯片将在结构上更接近人脑的神经构造,获得类神经计算的能力,通过不断整合最新的人工智能技术,定制型人工智能内核芯片将逐渐演变为通用型人工智能内核芯片,在提高自我学习能力的同时,实现对不同人工智能技术在不同任务上的加速计算,从而推动人工智能内核芯片实现真正的落地。

8、算法公平性研究推动AI应用走向普惠无偏见

由于数据偏差、算法本身缺陷、甚至是人为偏见的存在,现有AI算法普遍存在对于某些特定人群效果不公平的”歧视性现象”。

随着AI算法在社会各行业的广泛落地应用,作为辅助人们决策的重要工具,算法的公平性问题正受到越来越多的关注。过去的几年业界已在逐步探索一些针对性的解决方案,包括构建更公正的数据集、算法训练中引入公平性约束损失、提高机器学习算法的可解释性等。

但就整体而言,当前公平性研究在精度和公平性的平衡、不同场景的泛化性有效性等问题上正处于方兴未艾的阶段。随着欧盟发布《人工智能白皮书》、《人工智能伦理:问题和倡议》,中国发布《协同落实人工智能治理原则的行动建议》,人工智能的治理正成为一个愈加热门的议题,而算法的公平性正是人工智能治理的关键问题。

我们预见算法公平性的研究将持续深化,在人脸识别等最广泛的AI应用领域取得突破,为不同人群带来更加普惠无偏见的效果。

9、隐私保护AI落地实用帮助算法可持续进化

人工智能和机器学习算法的广泛应用,在为人们提供便利的同时,也带来了极大的隐私泄露风险。这种隐私泄露包括用户数据在授权范围以外被处理共享、机器学习算法训练后存在数据记忆等现象。

AI算法开发中的数据隐私保护问题受到的关注以及监管日益增长,美国于2020年生效《加利福利亚消费者隐私法案》,中国于2020年公布《个人信息保护法(草案)》。针对机器学习中上述隐私保护问题,研究工作近年来逐步深入走向成熟,发展出了数据匿名化、联邦学习、差分隐私等一系列方法。

我们预见能够保护用户数据隐私的更加灵活高效的AI学习方法将在金融、医疗、社交等场景实用化落地,消减用户的隐私担忧,帮助AI算法在场景中可持续地进化。

10、人工智能技术向安全智能方向迈进

随着人工智能技术在各行各业的广泛应用,滥用或恶意破坏人工智能系统将会给社会带来巨大的负面影响。

近年来算法后门攻击、对抗样本攻击、模型窃取攻击等针对人工智能算法的攻击技术持续发展,通过篡改构造特殊数据诱骗人工智能应用产生不可信的错误结果,带来了更大的算法安全风险,因此保障人工智能应用安全可靠的需求日渐迫切。

未来人工智能技术将向着安全智能方向持续演化,一方面从算法的可解释性入手提升模型的鲁棒性,另一方面化被动为主动,通过主动安全检测机制对各类攻击进行侦测与拦截,最终实现人工智能可用性与可信性双轨并重的现实需求,推动人工智能技术在更广泛领域的安全落地。

作为腾讯旗下顶级的人工智能实验室,腾讯优图长期坚持基础研究和产业落地两条腿走路,拥有超过1000余项AI相关国内外专利,300余篇论文被CVPR、AAAI、ICCV等国际顶会收录。在产业落地方面,腾讯优图通过腾讯云持续输出顶尖的视觉AI能力,目前已推出超过30个行业解决方案。

未来AI将会在这10个方向升级|腾讯优图联合厦大发布趋势预测相关推荐

  1. 无监督学习多模态融合!腾讯优图联合厦门大学发布2021十大AI趋势

    腾讯优图实验室联合厦门大学人工智能研究院发布<2021 十大人工智能趋势>报告,对 3D 视觉技术.深度学习算法.人工智能内核芯片等众多领域的发展趋势进行了预测. 6 月 5 日,2021 ...

  2. 腾讯优图×厦大再破三项医疗AI世界纪录,提升胸部多器官分割准确度

    李根 假装发自 芙蓉寺  量子位 报道 | 公众号 QbitAI 腾讯的救命AI征程,又往前迈出重要一步. 最新揭晓结果的全球胸部多器官分割大赛,腾讯旗下顶级AI实验室--腾讯优图与厦门大学王连生老师 ...

  3. 腾讯优图开源深度学习推理框架 TNN,助力 AI 开发降本增效

    从学界到工业界,"开源"已经成为AI领域的一个关键词.一方面,它以"授人以渔"的方式为AI构建了一个开放共进的生态环境,帮助行业加速AI应用落地:另一方面,在解 ...

  4. 腾讯优图发布四大平台产品,持续开放视觉AI能力

    7月10日,2020世界人工智能大会在上海举行,腾讯优图实验室总经理吴运声发表了"新基建新生态下的计算机视觉"的主题演讲,分享了优图视觉AI技术在工业.教育.泛娱乐等领域的最新落地 ...

  5. 腾讯优图·AI 开放平台全面升级:AI 能力最全面的平台

    欢迎大家前往腾讯云社区,获取更多腾讯海量技术实践干货哦~ 作者:优图实验室 人工智能是一项前瞻性科学研究,自信息技术产生发展以来,人们在这一领域进行了长期的科学探索和技术攻坚,并不断涌现出新思想.新观 ...

  6. 腾讯优图贾佳亚:当AI进入产业应用时代时,计算机视觉技术更应该服务于人才对!...

    作者 | 刘晶晶 出品 | CSDN云计算(ID:CSDNcloud) 从移动支付的自动贩卖机到刷脸支付的智能货柜: 从亲自到柜台验证到人脸核身远程开卡: 从排队买票.排队进门的糟糕旅游体验到提前预约 ...

  7. 实验室里的AI激情:腾讯优图的升级修炼之路

    一百多年来,信息技术从初兴到成为基础设施,成就了无数辉煌的科技巨头.如今,人工智能也正狂奔在通往社会通用性技术的路上. 要从上一波信息技术浪潮的产业规律中预测出AI的航海图,并不容易.但回到历史现场, ...

  8. 腾讯优图10篇AAAI论文解析,涉及数学速算批改、视频识别和语义分割 | 附下载...

    点击上方↑↑↑"视学算法"关注我 来源:公众号 量子位 授权转 AI顶会AAAI开幕在即,入选论文悉数披露. 今日介绍10篇论文,来自腾讯旗下视觉研发平台腾讯优图,涉及数学速算批改 ...

  9. AAAI 2020| 一文看尽腾讯优图10篇入选论文

    点击上方"深度学习技术前沿",选择"星标"公众号 资源干货,第一时间送达 人工智能领域的国际顶级会议AAAI 2020将于2月7日-2月12日在美国纽约举办.近 ...

最新文章

  1. php表单ajax,PHP表单到Ajax类型
  2. 查看linux机器性能,Unix Linux 查看机器性能
  3. datatable 查询_2020年浙江注册会计师成绩查询预告
  4. mysql函数 用来查询匹配不到的数据_erlang连接mysql数据库后为什么fetch说匹配不到这个函数...
  5. 减速箱箱体尺寸是怎样计算的_皮带输送机减速机漏油、油温高可不能小觑,原因及处理方法教给你...
  6. Android的Matrix 2
  7. 旅游管理系统设计图; 毕业论文概述
  8. Django使用livereload自动刷新页面
  9. 开源车牌数据集CCPD介绍
  10. libigl cot laplacian 计算方式
  11. pearson相关系数_SPSS相关性分析及相关系数计算方法(点二列相关系数)——【杏花开医学统计】...
  12. AndroidX适配教程
  13. 防范勒索软件的七大举措
  14. java 面包屑_java面包屑导航制作
  15. 中国移动车联网 V2X 平台白皮书
  16. 图像渲染测试软件,Arnold渲染器之aiImage(ai图像)着色器介绍及渲染测试
  17. 华为手机屏幕锁屏时间设置_如何设置屏幕锁屏时间华为手机
  18. 基于SEIR模型的网络医疗众筹传播建模与仿真分析
  19. 服务器 响应400,加载资源失败:服务器响应的状态为400:spring mvc
  20. python 搭建登陆系统,用Python连接操作MySQL数据库,做一个简单的用户登录注册系统...

热门文章

  1. 如何在bash中等待多个子进程完成并在任何子进程以代码!= 0结尾时返回退出代码!= 0?
  2. vue的插槽slot
  3. eclipse中设置python的版本
  4. 元素重叠及position定位的z-index顺序
  5. Tomcat 架构探索
  6. PHP- 深入PHP、Redis连接
  7. C# 可以利用反射给只读属性赋值吗?
  8. 脉冲神经网络_【强基固本】脉冲神经网络(SNN)
  9. python 对象_python面向对象
  10. Kali Linux安装中文输入法