点击上方“视学算法”,选择加"星标"或“置顶

重磅干货,第一时间送达

文 | 博雯
源 | 量子位

现在,AI能帮你200字看完一段12万词的长篇小说了!比如这样一段121567词的《傲慢与偏见》原文:

▲图源OpenAI官网

AI分四个阶段来总结:先把原文总结成276个摘要(24796词),然后进一步压缩成25个摘要(3272词),再到4个摘要(475词)。最终得到一段175词的摘要,长度只有原片段的千分之一:

粗略翻译下看看,关键的几个情节都点到了:

这理解力,不禁让人望着某泡面压留下了泪水。这就是OpenAI最新推出的能给任意长度书籍写摘要的模型。

平均10万词以上的训练文本,最终能压缩到400字以内。而且这也是源自OpenAI精妙的刀法:没错,就是把GPT-3数据集里的书籍/小说部分抽出来进行训练所得到的模型。

话不多说,一起来看看这个微调版的GPT-3模型。

递归任务分解

首先,现将“总结一段文本”这一任务进行算法上的分解。如果该文本足够短,就直接进行总结;如果它比较长,就把文本分成小块,并递归地对每一块进行总结。这就形成了一棵总结任务树:

其中只有叶子任务会对书籍中的原始文本进行操作。并且,已生成的摘要应该放在同一深度,并按照顺序串联起来。

比如上图中的蓝色任务的先前总结输出就用虚线来表示,这样,每一个摘要都是自然地从上一层任务(前文)流出,以保证那些相距较远的段落能够真正地“联系上下文”。接下来开始训练:

  1. 根据上述的任务树将书籍和其子摘要递归为任务;

  2. 从树上抽出一个节点,对应一个带训练的总结任务;

  3. 获得训练数据,给该节点以输入;

  4. 使用训练数据对模型进行微调。

其中,所有训练数据都来自GPT-3中的书籍部分。研究人员会跳过非叙事性书籍,尽量选择小说类(平均包含超过10万个单词),因为这些上下文关联性更强的文本对总结任务来说更难。

这一训练过程可以使用新的模型、不同的节点采样策略、不同的训练数据类型(演示和比较)来迭代。对于演示用的数据,使用标准的交叉熵损失函数进行行为克隆(BC)。

对于比较数据,则通过强化学习(RL)来对抗一个专为人类偏好而训练的奖励模型。强化学习也有三种变体的抽样任务:

  • 全树

  • 第一棵子树

  • 第一片叶子

训练完成后进行总结,任务的最终目的是追溯出叙述的时间线和整体主题。每个摘要子任务的目标是将文本压缩5到10倍,长度上限为128到384个符号。

优于现有同类模型

实验阶段,研究人员使用了Goodreads 2020榜单上的40本最受欢迎的书籍,其中囊括了幻想、恐怖、爱情、推理等近20个类型。然后让两名人类研究员和模型同时进行总结,要求双方的摘要质量的一致性接近于80%。

模型规模分为175B和6B两种,且训练模式也分为上述的强化学习的三种变体任务。最后结果中,可以看到第一棵子树RL和全树RL的总结任务最接近于人类的水平:

并且,也有超过5%的175B模型的摘要被打到了6分(满分7分),超过15%的摘要被打到5分:

研究团队也在最近提出的BookSum数据集上进行了测试,结果比现有的长文本总结模型更好:

除此之外,摘要是否能用来回答关于原文的问题也是评估方法之一。因此,团队将他们的总结模型应用于NarrativeQA问题回答数据集,可以看到,虽然没有经过明确的问题回答训练,但在所有的指标上都获得了最好的结果:

作者介绍

这篇研究出自OpenAI的 OpenAI Alignment team,他们表示,目前没有开源此模型的计划。论文一作Jeff Wu本硕都毕业于麻省理工大学,在加入OpenAI之前有过在谷歌工作的经历。

共同一作Long Ouyang本科毕业于哈佛大学,博士则毕业于斯坦福大学的认知心理学专业,主要研究领域为认知科学与概率规划研究。

论文:
https://arxiv.org/abs/2109.10862OpenAI

官网介绍:
https://openai.com/blog/summarizing-books/

参考链接:
https://venturebeat.com/2021/09/23/openai-unveils-model-that-can-summarize-books-of-any-length/

点个在看 paper不断!

200字带你看完一本书,GPT-3已经会给长篇小说写摘要了相关推荐

  1. 5分钟,带你看完24岁60W年薪架构师的简历,上面竟然写着精通JVM

    前言 近期,看了一份24岁60W年薪架构师简历,上面写着他的求职意向+所掌握的技能....... 所掌握的技能大部分写的都是精通!我不禁想问,大佬都这么强吗?你敢在简历上把所有的技能都写精通吗? 简历 ...

  2. 一文带你看完ZooKeeper!

    作者 | FrancisQ 来源 | JavaGuide " 文章很长,先赞后看,养成习惯.❤️ ???? ???? ???? ???? ???? " 什么是ZooKeeper Z ...

  3. 5分钟带你看完 WWDC 2018

    前言 一年一度的 WWDC(苹果全球开发者大会)于北京时间 6月5日 凌晨1点开幕.废话不多说,来看看这次WWDC 都有哪些亮点吧! iOS 12 和 ARKit 2.0 关键词:官方防沉迷最为致命 ...

  4. 【WWDC】10分钟带你看完苹果WWDC2022、iOS16、iPadOS16、macOS Ventura、watchOS 9

    WWDC 2022 四大系统 **iOS16** **iPadOS16** **macOS** **watchOS 9** **两大硬件** 重磅推出全新M2芯片和两款搭载M2芯片的硬件: **Mac ...

  5. 三分钟带你看完HTML5增强的【iframe元素】

    HTML不再推荐页面中使用框架集,因此HTML5删除了<frameset>.<frame>和<noframes>这三个元素.不过HTML5还保留了<ifram ...

  6. 10分钟看完一本书《极简主义》

    目录 总述 1. 通常来讲,比起寻找复杂的方法去做事,我们可以按照它相反的一面去做--第一个理念"事情其实很简单" 2. 在考虑任何企业.事业或者项目时,我们需要理解我们究竟想做什 ...

  7. 4000字干货,看完就懂什么叫产品设计与产品设计流程

    随着互联网的发展,工种变得越来越多,职责划分也越来越细,面向产品方向的也不只有产品经理了,还有用户体验.产品设计等等. 今天,就要通过 Canva 产品设计师 Gloria Lo 的一篇文章,来详细地 ...

  8. 当今主流分割网络有哪些?12篇文章一次带你看完

    作者 | 孙叔桥 来源 | 转载自有三AI(ID: yanyousan_ai) 本文的12篇文章总结了当前主流的分割网络及其结构,涵盖从编解码结构到解码器设计:从感受野到多尺度融合:从CNN到RNN与 ...

  9. 一张长长长图,带你看完项目管理全流程!

    虽然很多人已经学习过项目管理,也拿到了证书,但这并不意味着他真正掌握了项目管理的知识. 项目管理是一项极其重要的事情,有的公司以技术Leader为主导,有个公司以项目经理为主导,有的公司以产品经理兼任 ...

最新文章

  1. 【前端Talkking】CSS系列-css3之box-shadow介绍
  2. Eclipse开发C/C++之使用技巧小结,写给新手
  3. Search Engine XSS Worm
  4. 查看oracle的块大小,查看操作系统块大小
  5. Linux内核空间和用户空间
  6. 攻城掠地sdk服务器没有响应,攻城掠地没落的原因及对策
  7. nginx基础概念(100%)之keepalive
  8. [笔记]TB-6S-LX150T-IMG2_HWUserManual_1.02e实例讲解
  9. python的reversed函数实质_Python reversed函数及使用方法解析
  10. poj 2018 Best Cow Fences 二分查找dp
  11. 区块链教程Fabric1.0源代码分析flogging(Fabric日志系统)
  12. 读《About Face 4 交互设计精髓》1
  13. 声卡可以利用计算机进行,您决定听到什么!使用软件实现声卡分流
  14. CDR有哪些常用的快捷键
  15. 经度,纬度的正则表达式
  16. Sentinel-1 EW GRD数据SNAP处理
  17. emwin自定义字库
  18. Windows Server 2016-客户端加域端口汇总
  19. 语音编码标准(G.711 G.723 G.726 G.729 iLBC)
  20. CF - 1348D | 思维

热门文章

  1. vb 取得计算机名及目录
  2. 哈哈,我的博客开通啦,欢迎光临~~~~~~~~~~~~
  3. 【组队学习】【27期】集成学习
  4. 腾讯精选练习 50 题(Leetcode)笔记 PDF下载!
  5. opencv 自带库Canny边缘检测
  6. 关于 AIOps 的过去与未来,微软亚洲研究院给我们讲了这些故事
  7. 内含福利|CSDN 携手字节跳动:云原生Meetup北京站报名热烈启动,1月8日见!
  8. 中国的“Databricks”们:打造AI基础架构,我们是认真的
  9. RISC-V 正在成为芯片世界中的 Linux
  10. 滴滴AI Labs负责人叶杰平离职!CTO 张博接任