2021年11月,智源社区举办AI大调查,面向社区成员及广大AI领域的研究者和从业者,收集反馈意见和建议。目前已收到回复9000多份,根据智源社区2021AI大调查票选结果,我们选出了2021年人工智能领域十大技术进展事件,如下:

1.David Card、Joshua D.Angrist和Guido W.Imbens三人因对经济学研究的实证研究和因果推断的贡献获得诺贝尔经济学奖

挖掘因果关系是众多科学研究的目标。近年来在各个科学领域,特别是大数据和人工智能领域对因果推断研究的热情高涨,图灵奖获得者Judea Pearl 和Yoshua Bengio都认为因果推断是大数据和人工智能研究的一个突破口,人们需要一场“因果革命”来推动人工智能的发展。但因果推断也面临观察性研究、混杂因素、缺失数据带来的挑战。

2021年诺贝尔经济学奖授予加州大学伯克利分校的David Card、MIT的Joshua Angrist、斯坦福大学的Guido Imbens,以表彰他们在经济学研究的实证研究和因果推断方法方面的贡献,其科学背景是观察性数据的因果推断。

Card使用自然试验作为工具变量分析劳动经济学中一系列重要的因果问题,重塑或加深了人们对这些因果关系的认识,如发现提高最低工资并不会减少就业,推翻了人们对最低工资和就业之间关系的广泛认识。Angrist和Imbens将工具变量与潜在结果模型结合,使用潜在结果模型刻画工具变量假定和相应的统计模型,定义新的因果概念,发展新的统计推断方法—相当于重建了工具变量方法。

链接:https://hub.baai.ac.cn/view/12999

2.OpenAI发布多模态预训练模型DALL·E和CLIP

1月,OpenAI同时发布了两个大规模多模态预训练模型——DALL·E和CLIP。DALL·E可以基于短文本提示(如一句话或一段文字)生成对应的图像,CLIP则可以基于文本提示对图片进行分类。OpenAI表示,研发多模态大模型的目标是突破自然语言处理和计算机视觉的界限,实现多模态的人工智能系统。

链接:

https://hub.baai.ac.cn/view/5643

https://hub.baai.ac.cn/view/6636

3.谷歌发布1.6万亿参数模型Switch Transformer

1月,谷歌研究人员研发出新的语言模型Switch Transformer,包含1.6万亿个参数,是包含1750亿参数的GPT-3的九倍。研究者将Switch Transformer与谷歌研究的T5-Base和T5-Large模型进行了对比,结果表明,在相同的算力资源下,新模型实现了最高7倍的预训练速度提升。

链接:https://hub.baai.ac.cn/view/5807

4.智源研究院发布万亿规模超大规模智能模型悟道2.0

6月1日,智源研究院发布“悟道2.0”模型,参数规模达到1.75万亿,是GPT-3的10倍,打破由Switch Transformer预训练模型创造的1.6万亿参数记录,是中国首个万亿级模型。

链接:https://hub.baai.ac.cn/view/8375

5.AlphaFold2算法和蛋白质结构预测数据集开源

7月,DeepMind使用新开发的AlphaFold2算法预测出了35万种蛋白质的结构,其中包括人类基因组表达的约2万种蛋白质,以及其他20种生物学研究中的常用模式生物(如大肠杆菌、酵母和果蝇)表达的蛋白质,是过去用实验方法解决的蛋白质数量的两倍多。

研究发现,AlphaFold2能对人类蛋白质组中58%的氨基酸结构位置给出可信预测。35.7%的结构位置的预测达到了高置信度,是实验方法覆盖结构数量的两倍。在蛋白层面,AlphaFold2对43.8%的蛋白中至少四分之三的氨基酸序列都给出了可信预测,该研究于7月22日登上《自然》杂志。

DeepMind宣布,已与欧洲生物信息研究所(EMBL-EBI)合作建立AlphaFold DB蛋白质结构数据库,将覆盖98.5%的人类蛋白质信息,预测结果免费开放。12月,这项研究被《自然》杂志评为2021年度技术突破。

7月,华盛顿大学、哈佛大学等的研究者提出蛋白质结构预测算法RoseTTAFold,该方法基于深度学习,通过在蛋白质序列信息的学习,能够快速生成蛋白质的精确结构,减少传统方法在实验测定等方面投入的时间和精力。目前该算法已开源。

链接:https://hub.baai.ac.cn/view/13099;

https://hub.baai.ac.cn/view/8901

6.微软亚洲研究院提出Swin Transformer视觉预训练模型

8月,微软亚洲研究院研究者提出了Swin Transformer的视觉架构,一是采用CNN中常用的层次化构建方式,构建层次化Transformer;二是引入局部性(Locality)的思想,采用多种尺度的窗口,对无重合的窗口区域内进行Self-Attention计算。

实验结果表明,Swin Transformer在COCO的分割和检测任务以及ADE20K的语义分割任务上都超越了CNN,达到了最佳性能。Swin Transformer因其在计算机视觉领域的贡献获得ICCV2021最佳论文奖(马尔奖)。11月,Swin Transformer升级,可以训练分辨率达1536x1536的图像,在4个视觉基准上刷新纪录。

链接:https://hub.baai.ac.cn/view/12251

7.何恺明团队提出Masked Autoencoders视觉预训练方法

11月,Facebook何恺明团队提出了一种名为掩码自动编码器(Masked Autoencoder,MAE)的视觉训练方法。该方法在对于输入图像的局部进行了遮盖,并通过不对称的编码器-解码器结构对缺失像素进行重建。预训练后,撤除解码器,可将完整的图片输入编码器,使其完成视觉任务。实验结果显示,该方法在多种任务上都可以用更少的数据实现较高性能。

链接:https://hub.‍baai.ac.cn/view/11710

8.智源、清华等提出Pre-Train Prompt Tuning(PPT)框架

9月,清华大学黄民烈、刘知远等研究者提出了名为Pre-trained Prompt Tuning(PPT)的方法,目的是为了改进Prompt Tuning在小样本任务上的性能弱于Fine-tune方法的问题。研究者将分类任务(sentence-pair、multiple-choice、single-text)都统一到一种任务中,并预训练Soft Prompt。测试中,研究者采用了T5、mT5和CPM-2三种模型,对比了微调和多种Prompt Tuning训练策略的结构。实验表明,PPT在大多数任务上具有明显的性能优势。

链接:https://hub.baai.ac.cn/view/9890

9.斯坦福大学研究者利用AI和脑机接口实现“意念写字”

当前,脑机接口已经可以实现一定程度的大脑和计算机之间的沟通,如让瘫痪患者能够操控光标打字等,但是对于一系列高度灵巧的行为来说,解码这些行为背后的脑电信号需要更高精度的脑电解码方法。

5月,斯坦福大学的研究者提出了一种新型的脑机接口系统,采用循环神经网络,能够将来自运动皮层的手写字脑电信号解析为文本。在线情况下,该脑机接口实现了90字/分钟的速度,准确率为94.1%,在有自动纠错软件的支持下,离线的准确率高达99%。

链接:https://arstechnica.com/science/2021/05/neural-implant-lets-paralyzed-person-type-by-imagining-writing/

10.谷歌发布改进版视觉预训练模型ViT

2020年10月,谷歌大脑团队首次尝试将标准Transformer应用于图像,提出了视觉Transformer(ViT)模型,并在多个图像基准上接近甚至优于最佳性能。6月,ViT团队尝试将ViT模型进行扩展,训练出具有20亿参数的变体模型ViT G/14,在ImageNet数据集上达到了新的最佳性能。

链接:https://hub.baai.ac.cn/view/4653

你心目中的2021年人工智能技术领域十大进展是什么?欢迎点击阅读原文参与文章讨论!

智源社区票选2021 AI十大进展出炉!相关推荐

  1. 计算机专业竞争力度大吗,求职竞争最激烈十大行业出炉 计算机软件业榜首

    求职竞争最激烈十大行业出炉 计算机软件业荣登榜首 新快报讯 (记者 尹来 通讯员 郝健)昨日,智联招聘特推出<三月才情数据报告>.根据2009年3月的才情数据显示,全国竞争最为激烈的十大行 ...

  2. 06十大病毒出炉 毒王现身

    06十大病毒出炉 毒王现身 2007年1月10日,国内最大的计算机反病毒厂商江民科技发布2006年十大病毒排行, "威金"蠕虫超过***病毒位居十大病毒之首,成为2006年度&qu ...

  3. 智源研究院发布 2020 年世界十大 AI 进展

    跌宕起伏的2020年,似乎如梦如幻.但这一转折之年,对于AI领域却无比关键,世界各地先后出现了诸多颠覆性的进展,让人如痴如醉.譬如5月份出现的GPT-3,让人们突然看到了通用人工智能的希望:再如12月 ...

  4. 2019数字中台/CRM 十大新闻出炉:期待企业服务大变局!

    研究中台是一项非常有趣的工作. 数字中台的爆发点在哪里? 企业数字化转型的关键是什么? 传统的CRM在经历怎样的浴火重生? 2019年发生了哪些重大新闻? 一起来听听吧! 一个新趋势正在形成!全行业. ...

  5. 金山:2月新增病毒356万 十大病毒出炉

    随着互联网安全形式的逐渐严峻,重大病毒与高风险安全漏洞频频爆出.据金山毒霸云安全中心首发2009年2月月度安全报告显示,春节后的第一个月金山毒霸截获新增病毒样本数共计3563762个,新增漏洞20个, ...

  6. 全球工业半导体市场占有率十大排名出炉

    根据调研机构Semicast Research最新报告,2016年全球工业半导体市场规模为422亿美元,较2015年407亿美元,成长3.7%.主要成长动能仍然依靠于传统模拟IC.光电元件,以及功率元 ...

  7. SaaS/大数据2019十大新闻出炉:我们不是“孤胆英雄”!

    岁末年初,盘点正当时! 本文将重点围绕SaaS行业和大数据领域进行回顾, 旨在梳理过去一年该领域分别发生的十大新闻事件, 引发了哪些行业影响? 带来了哪些启迪? 一起分享吧. 回望2019,让人有太多 ...

  8. 选择报表工具软件的最新十大标准出炉

    现在越来越多的项目要用报表工具,但国内市场上报表工具很多,鱼龙混杂,面对如此多的产品,很难只从一个方面就分出高低优劣,必须多方面比较. 标准一:厂家的发展前景 如果厂家运营不善不赚钱,那么对产品和服务 ...

  9. 智源发布:2021 年十大人工智能技术趋势【附下载链接】

    在12月31日,智源研究院发布了 2020年十大 AI 进展.新的一年,人工智能又将走向何处? 2021年开年,全体智源学者经过深入研讨,从人工智能的基础理论.算法.类脑计算.算力支撑等方面进行预测, ...

最新文章

  1. TCP/IP 协议栈及 OSI 参考模型详解--云平台技术栈04
  2. win32: 查询滚动条相关信息的注意事项
  3. MIT华人博士研究新冠遭学术霸凌!斯坦福诺奖得主:“你论文少,别说话!”...
  4. Launcher代码大全
  5. patch -p0 和patch -p1的区别
  6. SAP Cloud Application Programming 介绍(2021 更新版)
  7. 医学图像数据集和处理工具【总结】
  8. 二分法求数组最大最小_JavaScript之如何求数组的最大值和最小值
  9. java oracle连接数据库_Java 连接 Oracle 数据库
  10. python中object类的源码在哪里-[Python之路] object类中的特殊方法
  11. week15(字符串集合:Hash、字典树、KMP)
  12. matlab global rbfnet,基于RBF简单的matlab手写识别
  13. 比较好的英文学习网站
  14. .xyz让域名应用充满艺术感
  15. window.addEventListener()和document.addEventListener()区别
  16. 【共阳极高辉度无频闪调光IC方案FP7125】耐压100V10A LED降压恒流PWM调光芯片 汽车大灯车灯照明/调光电源应用
  17. Text to Speach文本转语音实现
  18. 网页设计与制作第一课:什么是html,html基础与文本控制标记
  19. Eclipse插件6
  20. 电脑拓展显示器软件显示不清晰问题

热门文章

  1. c语言gcno文件位置,makefile - 具有覆盖率的CMake Ninja将gcno文件放在根二进制目录中 - 堆栈内存溢出...
  2. note同步不及时 one_你的生活一团糟,就是因为不懂得管理
  3. java bitmap base64_Android Bitmap到Base64字符串
  4. 7-20 打印九九口诀表 (C语言)
  5. 将一个3 * 4的二维数组转换为4 * 3的二维数组
  6. cpu满了卡住 linux_Linux系统中CPU占用率较高问题排查思路与解决方法
  7. 企业互联网应用高性能解决之道
  8. Android VideoView播放网络视频简介(转)
  9. 神经网络入门——14多层感知机
  10. 基于workerman实现的web消息推送站内信功能