AI改写《权游》结局,和编剧比谁更烂?
作者 | Chintan Trivedi
译者 | 刘畅
责编 | Jane
出品 | AI科技大本营(id:rgznai100)
前言
《权力的游戏》结局烂尾?
《权力的游戏》第八季崩盘,在一片“烂尾结局”的评价声中落下了帷幕。采访身边很多剧迷的观后感,一位同事给的评价只有一句话:“书是一本好书”。
近日,国外,Medium 平台一位作者也分享了他的感受:
“权力的游戏”第8季的故事情节,因为其匆忙而不尽如人意的结局,让数百万名粉丝(包括作者)十分失望。大部分人都在呼吁重写该剧的最后一季,而其他人为了让自己舒心,则想出他们自己版本的结局。大家都在等待GRRM完成他的书,希望他能塑造一个更令人难以置信的角色,但这可能需要很多年。
作为一名技术人,任何问题都会忍不住想一下:技术能不能搞一下?
如果让 AI 学习 GRRM 的写作风格,然后写一个结局如何?
AI 能写得更好吗?
随后,作者便用年初 OpenAI 提出的 GPT-2 文本生成模型实践操作了一波。模型学习的是《冰与火之歌》(A Song of Ice and Fire)原著,输出三大反派人物(the Night King, Cersei Lannister and Daenerys Targaryen)的结局。
接下来的内容,我们会先简单一下 GPT-2,详细的介绍可以参考我们以前给大家推送的文章;然后介绍一下作者训练模型的方法;最后根据模型生成结果进行总结与反思。文章没有涉及非常详细的技术细节,而是从方法上帮助大家整体把握,后续无论是增加数据集,还是结合自己需求做调整,思路都可以借鉴,对技术细节没有进行详细说明。
GPT-2(生成预训练的迁移模型)
在现有的 AI 语言模型中,GPT-2 是一种达到了 SOTA 效果的文本生成模型。他能生成类似人类语言的连贯性语句,并且可以长期关注某个主题。 相比于其他语言模型,GPT-2 两个较大改进在于:
大量数据:研究人员抓取了 800 万个网页,制作了一个 40GB 的文本语料库,用于进行无监督的训练。它涵盖了各种各样的主题,这就是为什么预先训练的模型非常适合迁移到特定领域,比如这次我们用到的原著 GoT。
大量计算:Transformer 模型结构中使用了 15 亿个参数。不过,出于安全考虑,他们发布了仅包含 3.45 亿个参数的较小版本。这次的模型也是使用这个版本。
迁移模型
GPT-2 使用的是 Transformer 网络架构,而不是序列建模传统模型 RNN、LSTM 等网络。不同之处在于 Transformer 使用基于注意力机制的解码/编码器,而不是拥有'memory'门和时间步长的循环单元。
编码器利用字节对和位置嵌入处理输入,其中位置嵌入描述的是输入句子中“嵌入的单词”和“在何处嵌入”。相同的编码器将字节和位置嵌入转换为矢量编码,然后将该矢量编码输入解码器,解码器的任务是将编码转换为目标文本序列。 该输出和来自前一步骤的编码被馈送到下一个编码- 解码步骤,并且重复多次,以产生更好的文本序列。
下面的链接文章详细的解释了这个模型架构:
https://blog.floydhub.com/the-transformer-in-pytorch/
而 GPT-2 就可以经过训练,预测给定输入句子中的下一个单词。如果模型可以相当准确地预测下一个单词,那么模型可能具备理解输入单词上下文含义的能力。如果不理解文本,语言模型只能预测符合语法规则的单词,而生成的文本可能不会符合语义规则。不同于机器翻译任务中的 seq2seq 模型,GPT-2 仅使用预训练模型 Transformer 中的解码器来生成后续文本,在文本生成期间并不需要编码器。
训练模型
数据:作者从《冰与火之歌》的 5 本书中摘录,组合文本数据用于训练。
模型:预训练 GPT-2 模型包含 345M 参数。
时间:该模型在 Google Colab 的 K80 GPU 上训练了大约12个小时。
在训练过程中,作者意外发现,预训练模型很擅长撰写《权利的游戏》里的角色特征,可能与在初始训练期已经接触过这些内容有关。想让模型撰写的内容更贴近 GRRM 的风格,需要继续利用 GoT 数据集。
结果与分析
先在原剧结局中,找出一些令大家感到失望的情节,然后再尝试用训练好的 GPT-2 模型生成结果,详细结果大家可以看下面的视频介绍,后面会对一些文本输出做部分介绍。
以下是视频格式的输出,后面是相同的文本输出。
https://youtu.be/_vSov4sldsQ
下面分析一下选取的 3 个场景
失望场景 1:重写 Night King 虎头蛇尾的结局
根据 GPT-2,Hodor还活着并赶来救营 Bran,这真是一个转折点! 或者可能是 Hodor的灵魂进入了 Bran 的身体。不过之后,也不知道这个模型想说些什么。。。
Lightbringer 是杀死 Night King的剑。如果 Night King 的冰剑原来是 Lightbringer 并且最终会杀死他,那会有多酷?!
就算编剧忘了,不过 GPT-2 还记得关于 Azor Ahai 的预言,还围绕 Lightbringer 做了不少展开。
这里有个地方很有意思,不是因为故事写得精彩,而是因为模型居然知道 the dragon 实际上是“Other”(也就是书中的 White Walker)。将所有这些细节正确地放在一个段落中,真的太奇妙了。神奇的是,这个模型已经完全了解有关人物的这些细节!
失望场景 2:Cersei Lannister 在没有任何计划或适当的战斗的情况下倒下
嗯,好吧,这个生成的剧本完全是垃圾。 但作者还是保留了它,然后再试了一次!
这次稍微好一些! 虽然模型输出的某些细节错了,特别是关于 Mad King,但”Jaime试图在那一刻给予 Cersei 力量的想法“还挺不错的。 也许在这个时候使用某种野路子会给她的故事情节带来一些正义感。 两个疯狂的女王,激烈战斗,毁坏城市的剩余部分。 这也不失为一个更好的结局,表明为什么 Iron Throne 的战争是不好的。
失望场景 3:Daenerys 急速转弯的结局
总是吃喝的好时光?我听说 King's Landing 有一家很好的咖啡店,Dany 可以尝试(如果它还没有被烧掉)
这段真是挺垃圾的,让我们再试一次。
这段也没有多大意义。两次下来,似乎模型坚持 Dany 想要将 King's Landing 的人们从暴君手中解放出来。
总结
虽然尝试为这些故事情节生成更多的样本,但没有哪个能在故事背景下讲得通。尽管生成的故事文本不够好,不过也能看出来模型清晰地描述了角色特征和技能。,并且在模型输出结果中也体现了彼此之间的关联。此外,作者认为 OpenAI 提出的 GPT-2 研究工作,也体现了近来 NLP 领域取得的一些进展。
同时,我们和作者一样,都很好奇在最大的 GPT-2 模型上训练会取得怎样的结果?毕竟模型训练数据也不是十分充分,感兴趣的小伙伴们可以把原著所有的文本数据加入到最大的 GPT-2 模型训练中,看看是有更多惊喜还是惊吓?
而无论是编剧的结局,还是 AI 改写的结局,其实大家心目中的 Perfect Ending 还是要等 GRRM 赶快写完他的书。
(*本文为 AI科技大本营编译文章,转载请微信联系1092722531)
◆
精彩推荐
◆
6月29-30日,2019以太坊技术及应用大会 特邀以太坊创始人V神与以太坊基金会核心成员,以及海内外知名专家齐聚北京,聚焦前沿技术,把握时代机遇,深耕行业应用,共话以太坊2.0新生态。
扫码或点击阅读原文,既享优惠购票!
推荐阅读
代码有温度 科技需向善
谷歌开源张量网络库TensorNetwork,GPU处理提升100倍!
B站超全分享!2万人收藏的免费计算机科学速成课
罗永浩的开源情怀
被5月GitHub Top20榜单惊呆了! 原来区块链大佬都在做这个...
惊!为拯救美国落伍的 STEM 教育,纷纷出手教老师编程?!
超级黑幕:开发者千万别被算法迷惑了!
高考倒数 2 天!程序员惊现最燃表白!
从流感预测到智能决策,深度学习能帮企业做哪些事?
有一种青春叫高考,Python爬取历年数据,说说我们一起经历的高考
点击阅读原文,查看更多精彩内容。
AI改写《权游》结局,和编剧比谁更烂?相关推荐
- AI 改写《权力的游戏》结局,和编剧比谁更烂?
作者 | Chintan Trivedi 译者 | 刘畅,责编 | Jane 出品 | AI科技大本营(ID:rgznai100) 前言 <权力的游戏>结局烂尾? <权力的游戏> ...
- GitHub上能让你重拾学习热情的AI项目:权游预测/AI作画/与AlphaZero对弈
你是否觉得入门AI一段时间,更多是跟公式,代码打交道,感到枯燥?快要失去学习动力了?今天带你了解GitHub上都有哪些好玩有价值的项目,一起重拾学习热情吧! <权力的游戏>预测 4月15号 ...
- 《沙丘》编剧、《权游》作者:MS-DOS我能再用五十年
<沙丘>编剧.<权游>作者:MS-DOS我能再用五十年!-品玩 科幻迷期待已久的神作<沙丘>电影版(2021)终于在前不久全球公映了. 这部恢弘的史诗电影,改编自美 ...
- 利用Python和R对权游剧本进行NLP情绪分析
文章目录 1. 背景知识 2. 准备数据 Python R 3. 数据清理 4. 数据分析 5. 收获 最近学会利用Python做了几个词云后,又应用NLP中情感分析,结合snownlp库完成了词云分 ...
- 《权游》第八季震撼开播,10行代码动态展示其中的爱恨情仇
笔者是<权力的游戏>忠实粉丝,而随着第八季的开播,我相信整部剧也将迎来高潮,人类要跟亡者军团进行交战了,到底是亡者军队击溃人类,还是人类打败亡者军队呢?王座到底会花落谁家? 让我们用R语言 ...
- 人物关系java_《权游》人物关系你还捋不清?Neo4j帮你5分钟搞定!
点击上方 蓝字 每天学习数据库 万众瞩目的<权力的游戏>第八季,伴随着"史诗级大烂尾"的哀怨声,终于完结了! 面对剧中错综复杂的人物关系,新粉们是不是已经捋不清楚了?不 ...
- oracle执行视图的权游,VR、Ncam、Simulcam齐上阵!《权游8》重点镜头技术详解
" 感知CG · 感触创意 · 感受艺术 · 感悟心灵 " 中国极具影响力CG领域自媒体 文/索菲亚·嘟胖 正文共计6370字,预计阅读时间16分 差不多是在上个月吧,有消息说&l ...
- 通过AI自学习,Google让Pixel 3的人像模式更优秀
通过AI自学习,Google让Pixel 3的人像模式更优秀 Link: https://news.cnblogs.com/n/613720/ 虽然双摄手机已经在市场上普及,其所带来的人像模式.多倍变 ...
- 预测《权游》角色生死,AI算法魔力何在?
早在2016年,<权力的游戏>第六季播出之前,慕尼黑工业大学(TUM)的学生就开发了一款AI应用程序,来预测剧中人物的存活情况. 近两年之后,<权力的游戏>第八季,也就是最后一 ...
最新文章
- PHP中的字符串 — 表示方法
- 让PasswordRecovery控件使用Email地址找回密码
- asp.net mvc4开启SqlServer 会话共享模式
- C语言试题十六之写删除字符串中指定下标的字符。其中,a指向原字符串,删除后的字符串存放在b所指的数组中,n中存放指定的下标。
- Sublime Text 3 、WebStorm配置实时刷新
- net start mysql 服务名无效_记一次服务器被植入挖矿木马cpu飙升200%解决过程
- JSP页面添加播放视频功能
- 手把手实现Java图书管理系统(附源码)
- 基于51单片机的带方位指示的自行车码表proteus仿真原理图PCB
- 二级分销系统开发源码可以用多久?
- 【高效程序员系列】3 别碰鼠标——让键盘飞起来
- 重庆轻工职业学院计算机期末考试,重庆轻工职业学院教务网络管理系统 http://183.230.5.161:8082,精英高考网...
- 禅与摩托车维修艺术中提到的“刀”
- android微信分享icon不能显示,微信分享 icon图片不显示问题
- ETL工程师 2021-11-14
- RK3568 Android11.0.1 电池充放电管理
- KingScada 组合框/列表框使用
- 刀锋战记2服务端手游开服架设服务器搭建需要什么
- html中table表格分页,纯JS实现表格分页
- js刷新页面,刷新当前页