随着我们接近 2021 年底,arXiv 上的论文首次发表量增长似乎正在放缓:经过几年持续呈指数增长(每年 30-40%)后,看起来 2021 年的发表量 2020 年的排名仅略高于 2020 年(高出约 10%)。 我们会看到 NeurIPS 和 ICLR 的强劲增长吗? 或者人工智能研究已经成熟?

让我们先从过去几周的一些热门新闻开始:

EMNLP将于 11 月 7 日至 11 日以线上线下混合形式举行:同时在线和在多米尼加共和国蓬塔卡纳举行(这个地方你都没听说过吧,它可是海滩度假的最佳选择之一,所以你懂的)。官方公开会议将很快在 ACL 选集中出版。

Deepmind 收购了 MuJoCo 并将其开源。MuJoCo 是机器人和 RL 中使用最广泛的物理模拟软件之一,而且它非常的贵。大型学校和科研机构肯定有实力为他们的学生和教职员工购买许可证,但这下好了我们穷人也可以进入迈过过这个门槛了。

微软发布530B参数模型。但是它仍然只是一篇博客文章!他们声称这是迄今为止最大的monolithic transformer;你可能会问monolithic 是啥意思?这是一种使用所有参数的方式,与专家混合 (MoE) 类型的模型不同,例如 Wu Dao 的 1.75 万亿或 Switch Transformer 的万亿(在每个推理/训练步骤中只激活较小的子集)。虽然庞大的规模看起来非常令人难以置信,但我们必须等到他们更深入地分享才能够了解细节。说到参数,我们现在还是关心他们的大小。

人工智能投资者 Nathan Benaich 和 Ian Hogarth 最近发布了《2021 年人工智能状况报告》(www.stateof.ai)。它提供了有用的 AI 年度执行摘要:研究、行业、人才、政治和预测。绝对值得一读!

如果你想尝试用于计算机视觉的基于注意力的大型架构, Scenic [4] 最近发布一个代码库(包含大量样板代码和示例)来运行用于计算机视觉的 JAX 模型,包括几个 Vision Transformer [6]、ViViT [7] 等等。

如果你正在使用图像的生成模型,可以关注下VQGAN-CLIP,这是一个可以将自然语言句子转换为图像。

下面来看看论文:

Recursively Summarizing Books with Human Feedback

By OpenAI et al.

非常长的文档摘要(例如书籍规模)对于机器来说是一项艰巨的任务,主要是因为注释数据非常耗时:要注释一个示例,一个人需要阅读一本书并得出它的摘要, 这需要几个小时甚至几天。

长摘要可以(在某种程度上)成功地分解为分批式摘要任务,这些任务的注释成本更低:将一本书分成几块,然后将每个块总结成摘要。 连接这些摘要并总结它们。 递归地应用此过程,直到达到所需的全书摘要长度。

我们来大致了解一下所涉及的数据的规模:使用了40本书,平均10万字,大部分是小说,每个摘要子任务压缩的比例约为5-10比1。

这一过程的结果仍然与人类的质量相去甚远,只有5%的摘要达到了可比的质量。有趣的是,模型大小似乎起着重要作用,因为他们从最大的模型中总结出来的结论明显优于遵循同样训练过程的较小模型。

这又是一次令人印象深刻的人工循环训练复杂大型模型的工作。 距离产生“哇,这真是太棒了”的感觉还差得很远,但这是一个开始。 接下来可能的研究方向是如何将其转化为只需要很少或非常稀疏的人类注释的场景?

Multitask Prompted Training Enables Zero-Shot Task Generalization

By Victor Sanh, Albert Webson, Colin Raffel, Stephen H. Bach. et al.

惊人的大型模型研究主要限于拥有大量预算的公司。 这是 Hugging Face BigScience Workshop 的第一篇论文,该论文提出合作方式使大规模 ML 对大学等小型机构可行。 这不是第一个开源的大型 GPT-3 样模型(例如查看 GPT-J),但这肯定会产生影响。

他们谈论的是一个 110 亿参数模型,完全开源并可通过

2021年11月推荐阅读的10篇论文相关推荐

  1. 2021 年 10 月推荐阅读的10篇精选ML论文

    每个月都会有几千篇的论文在arXiv发布,我们不可能看完所有的文章,但是我们可以从中找到一些趋势: 大型语言模型不再与较小的模型在同一类别中竞争(如训练前+监督数据微调).为什么?这已经没有意义了,因 ...

  2. 学习GAN必须阅读的10篇论文

    本文转载自:魔图互联.欢迎访问网站查看详细教程:Tensorflow(pytorch)系列教程 生成对抗网络是深度学习中最有趣和最受欢迎的应用之一.本文将列出 10 篇关于 GAN 的论文,这些论文详 ...

  3. 计算机视觉最新进展概览2021年10月31日到2021年11月6日

    参考计算机视觉最新进展概览2021年10月31日到2021年11月6日 - 云+社区 - 腾讯云 1.Learning Distilled Collaboration Graph for Multi- ...

  4. 抑郁症最新研究进展(2021年11月)

    ​​推荐阅读:<AD.hi v.癌症.新药.基因编辑.CAR-t等最新进展合集(每周更新)> 据估计,全球有3.5亿人受到抑郁症的折磨,目前我国有超过9500万抑郁症患者,这种疾病会严重影 ...

  5. 艾滋病/HIV最新研究成果进展(2021年11月)

    推荐阅读:<细胞治疗.基因编辑.生物制药等各领域最新研究进展消息合集> 根据中商产业研究统计数据,中国抗艾滋病治疗药物市场规模已从2013年的7.9亿元增至2018年的20.2亿元,预计2 ...

  6. 新鲜出炉 | 临床基因组学数据分析实战将于2021年11月12-14开课!!!

    福利公告:为了响应学员的学习需求,经过易生信培训团队的讨论筹备,现安排<临床基因组学数据分析实战>于2021年11月12-14 线上/线下课程 (线上课是通过腾讯会议实时直播线下课,实时互 ...

  7. 2021年11月23日对自己的一次鼓励

    2021年11月23日 author:陈镇坤27 创建时间:2021年11月23日15:23:31 ------------------------------ 学习犹如逆水行舟,不进则退 从今年7月 ...

  8. 关于2021年11月28日PMI认证考试的报名通知

    尊敬的各位考生: 经PMI和中国国际人才交流基金会研究决定,中国大陆地区2021年全国第二期PMI认证考试于11月28日举办,相关事项通知如下. 一.时间安排和举办地区 (一)考试时间:2021年11 ...

  9. 【系统集成项目管理工程师】2021年11月上午+下午真题及答案解析

    软考大讲堂2021年下半年系统集成项目管理工程师真题答案已经发布!帮助大家在线免费估分,"提前"知晓分数! 2021年11月系统集成项目管理工程师 上午题 1.2020 年 4 月 ...

最新文章

  1. JavaScript关键字this指向
  2. RHEL7系统管理之内核管理
  3. MySQL中使用innobackupex、xtrabackup进行大数据的备份和还原
  4. Linux操作系统上lsof命令详解
  5. java中new BigDecimal的坑
  6. mxnet基础到提高(4)-- Dense层基础
  7. mysql 事物的持久性是指_详解MySQL中事务的持久性实现原理
  8. CVE-2017-8046(Spring Data Rest RCE)
  9. declspec(dllexport)和declspec(dllexport)的实际应用
  10. 解决Intellij IDEA中找不到汉化包问题
  11. 计算机微信接收excel打不开怎么回事,微信打不开收到的Excel
  12. 电信物联网平台对接教程
  13. mysql错误:Found option without preceding group in config file
  14. 一阶电路暂态响应的结果分析。_【技术】关于开关电源的分析、计算、仿真
  15. 关于人工智能的几点看法
  16. java实现文件上传下载功能
  17. Chapter 4 Part 5 WPAS扫描源码走读
  18. 基于COF智能屏的桌面式3D打印机方案
  19. 《武道神尊》12.29上线链游玩家|放置挂机、轻松修真
  20. 什么!作为程序员你连英文版的官方文档都看不懂?

热门文章

  1. console.log()打印花样颜色
  2. python 计算器 eval ctf_python 的eval函数
  3. 【小知识】有趣代码注释图案【持续收集更新...】
  4. OWASP TOP 10-2021年十大Web应用安全风险榜单
  5. java获取文件大小_Java实现获取文件大小的几种方法
  6. cocos2dx显示html,cocos2dx-js 初探 整体流程helloworld.html分析(示例代码)
  7. z怎么搭建linux网站,Linux znew初学者命令实例教程
  8. 14.JDK底层Unsafe类是个啥东西?
  9. 学猫叫歌词计算机,学猫叫歌词 小峰峰(陈峰)、小潘潘(潘柚彤)_晴格歌词网
  10. 罗克韦尔 DeviceNet配置软件