明敏 萧箫 发自 凹非寺
量子位 报道 | 公众号 QbitAI

高考刚过去不久,就有AI来“挑事”了。

这不,有个AI读完了毛选和鲁迅全集后,大笔一挥,写下好几篇高考作文。

结果……竟然还可以?

我们直接看文章:

看看这字里行间的青春与朝气,根本看不出是AI写的啊!

还能紧跟时事,“民族伟大复兴”这样的热点词用得游刃有余。

引经据典也不在话下:

一句“实践是检验真理的唯一标准”,立刻让文章高大上了起来。

一眼望去,通篇全是踩分点

让人不禁猜想:难道AI写作文终于狗屁通了?

吃瓜群众也非常好奇:这样的文章到底能拿多少分?

既然如此,不如就让我们来当一次改卷老师,看看这个AI到底能拿多少分。

考场作文套“模板”利器

首先摆在AI面前的是2021年全国甲卷的考题,主题是“可为与有为”,具体题面如下:

AI一上来的表现就不俗,《青年代表说》这主题就令人直呼“高啊”。

在题目中并没有提到“青年”二字的情况下,AI居然还能找到这样的切入点,这有点看头啊?

而且它还很鸡贼,开头直接抄了题目中的内容,这就叫“点题”。

甚至连我们写作文必备法宝——排比,它都用得游刃有余。

三大段排比,情绪逐层递进还能凑字数。

而且作者@图灵的猫介绍,这种排比句式是AI直接生成的,并没有二次调整。

这可能是因为AI在训练过程中“记住”了这种语法结构,就运用了起来。

再看看结尾,这也是高考作文的重头戏。

AI依旧熟知我们的套路,一通拔高、升华,让改卷老师都不好意思打低分(不是)。

这么看来,AI真的能写出让人满意的考场作文了?

话先别说太早,因为在之后的两套题里,它的表现就有些不尽如人意了。

首先要吐槽的,就是它每一次写作文,都会用抄题目的方法来凑出开篇。

其次,它虽然使用了金句技能,马克思主义理论、李白诗句用得飞起,但是在文章的逻辑处理上,依旧不太行。

比如“是否拥有以后一辈子的生命”,这句话显然不是中文的逻辑。

简称不说人话

而且它写出来的内容,总是在金句和废话之间徘徊。

就像下面这一段内容,每一句话单拿出来看都还可以,但是连成一段后,怎么又有点狗屁不通那味儿了?

此外,不知道是不是因为读了《鲁迅全集》的缘故,AI好像有点搞不懂我们现在的时代背景了。

这一段中的“三十载已过”,也是个令人有些摸不着头脑的时间概念。

有网友总结了一下自己的感受:

挑战一下鲁迅的题目

本着看热闹不嫌事大的原则,光看现有案例怎么够,我们当然要上手试一下它的水平究竟如何。

既然是读过《鲁迅全集》的AI,那我们就让它根据鲁迅的名言写一篇文章。

愿中国青年都摆脱冷气,只是向上走,不必听自暴自弃者流的话。能做事的做事,能发声的发声。

这段话大家一定耳熟能详,那让AI以此为题写一篇作文,画风会是啥样?

按照它的套路,开篇还是抄题目,所以我们直接来看第二段。

AI直接提出了青年人要自信的主题,看来《鲁迅全集》没有白读,对于题目的理解还是很到位的。

之后的内容则对题面做了更加直白的解释,告诫青年要努力啊!奋斗啊!

看得我直呼别骂了…

接下来也是常规操作了,梅花香自苦寒来,金句一出、逼格拉满。

文末还回到了现实生活,呼吁青年要着眼当下,才能有更美好的未来。

同时还加入了科技创新、大国崛起的要点。

由此可见,AI写作文在把控主题上可以说是so easy。

考虑到真实的高考作文题目中,有许多都是设问再回答,所以我们也试了试给AI一个问句,会发生什么。

在拿到文学应当如何改良?这样的命题后,AI很自然地说了句套话。

这第一段看上去非常具有哲理性,但究其本质,就是车轱辘话罢了。

这样的问题在其他生成的文章中也十分常见,而且还会冒出来错别字、语病等小毛病。

与此同时,我们还发现它似乎不太能承受住奇葩一点的题目…

在把一道网传的奇葩作文题目交给AI后,它直接写出来了一篇意识流。

这还只是第一段,后面的内容还出现了红色气球、子弹、龙牙、警察等等让人完全摸不着头脑的内容。

不止是奇葩题目,在涉及“古人”的题目时,AI还会冒出一两句奇形怪状的文言文来:

果然,还是现代主题的高考作文更适合AI发挥。

网友神总结:这就是个狗屁稍通文章生成器。

5大模块,读题作答“一条龙”

上面这些偶尔“超常发挥”、平均挣扎在及格线上下的文章,源自一个名为EssayKiller的AI写作框架,本质上是个多模块异构深度神经网络。

据模型作者@图灵的猫表示,这个AI生成文章有点“捉襟见肘”的原因,也是因为采用的模型不是最先进的。

由于经费不足更好的模型没有开源,因此只能用GPT-2来生成文字,如果能用上GPT-3和华为盘古,效果肯定比现在更好。

据了解,EssayKiller基于OpenCV开发,参数量达到17亿

从结构上看,这个AI框架主要包括5部分:输入、识别网络、语言网络、判分网络和输出。

相当于我们平时的“5步写作文”:拿到试卷、看题、打草稿、错误检查、写答题卡。

其中,看题、打草稿和错误检查几个模块,都会被拿出来单独训练,各司其职。

看题部分,EssayKiller首先采用了OpenCV的EAST文本检测器,能以13帧/秒的速度,扫描任意方向、大小的720p图片文本,并将其中的文字检测出来。

然后用OCR模型中的CRNN,对这些文字进行识别。

例如,将上面这张图片中的文字,转换成能直接输入模型的文本信息:“三写作70分……”

至于打草稿部分,则分为阅读理解、文本联想两部分,分别由BERT和GPT-2来完成。

BERT会将接收到的句子信息进行拆分、打碎,提取其中的关键词来,并将这些“必须出现在内文”的关键词交给GPT-2;

GPT-2在收到关键信息后,就能根据要求开始“大做文章”,每句话都与关键词密切相关,无时无刻不在“点题”。

但GPT-2生成的文章,还不符合高考作文的标准。

要想让这些句子看起来流畅成段,还得筛去一批真·狗屁不通的病句,并检查句子中的拼写错误、机翻等问题。

这就是错误检查部分,EssayKiller直接调用了百度模型DNN的API,主要原理是对句子中的词语进行分析,并判断它们是否处在正确的位置上。

在这3大关键步骤完成后,就可以正式排版成答题纸的格式,并用手写机器人输出了(相关模型也是开源的)。

看起来不错,已经有网友迫不及待想拿来写小作文了:

打住!

据@图灵的猫表示,不希望有人用EssayKiller来写作业,因此并没有开源相关参数设置,colab的调用次数也有严格限制。

要是出现违规行为,可能整个开源项目都会被关闭,同时也没法用Colab在线体验了。

到底“消化”得怎么样?

@图灵的猫介绍说,要想让AI模型写出这种效果的作文,在“语言生成模块”的训练集中,毛选和鲁迅全集等著作占比要超过10%

而模型的其他训练资料,则主要来源于开源中文散文数据集、高考作文数据集等。

那么,训练出的模型效果,是否符合预期呢?

不少网友表示,感觉AI还是“读进去了一部分”的:

而对于作者@图灵的猫来说,生成作文的质量也确实“比自己预期要好一些”。

但这并不表明,AI就已经能100%写出像样的高考作文了。

毕竟,最终呈现出来的几篇高考作文,都是在语言生成模型后,经过机器判分+人工筛选,才展示在读者面前的。

而在作文中所呈现出的排比等高级修辞手法,也只能说明训练语料中包含这类修辞,而AI模型在学习的过程中“记忆”了它们,并不能说明已经学到了这些手法。

换而言之,这次的AI模型,效果确实超乎预期,但并不意味着它真正“消化”了这些语料。

那么,这个AI模型接下来还会试些什么?

@图灵的猫表示,下一步的目标是“科幻小说”:

要是有空的话,我会将大刘、阿西莫夫和阿瑟克拉克等科幻作家的作品加入训练集,让AI模型试试写科幻小说。

嗯,AI写作开始有点赛博朋克那味了。

欣赏了毛选和鲁迅文集的开源AI模型:
https://github.com/EssayKillerBrain/EssayKiller_V2

Colab版在线生成器:
https://colab.research.google.com/github/EssayKillerBrain/EssayKiller_V2/blob/master/colab_online.ipynb

参考视频(已授权):
https://www.bilibili.com/video/BV1aw411f7G9

— 完 —

把毛选和鲁迅全集喂给AI后,写出来的高考作文太对味了相关推荐

  1. 把毛选和鲁迅全集喂给AI后,写出来的作文太对味了

    本文转载自量子位 高考刚过去不久,就有AI来"挑事"了. 这不,有个AI读完了毛选和鲁迅全集后,大笔一挥,写下好几篇高考作文. 结果--竟然还可以? 我们直接看文章: 看看这字里行 ...

  2. 用AI写出的高考作文!

    今天是6月7日,又到了每一年高考的日子.小灰自己参加高考是在2004年,距离现在已经将近20年,现在回想起来,真的是恍如隔世. 今天高考语文的作文题是什么呢? 全国甲卷的题目是:人·技术·时间 人们因 ...

  3. 如果让 AI 来写高考作文,能得多少分?

    大家好,我是树义. 不知不觉,这两天又是高考的时候.距离我高考已经过去了整整 12 个年头了,想想那时候智能手机也不怎么普及,不像现在那样人手一个智能机. 现在不仅信息技术发达,人工智能技术也是突飞猛 ...

  4. 这就是AI写的高考作文吗?简直绝了!

    不知道朋友们有没有关注今年的高考作文题目呢? 我简单了解了一下,感觉难度还是挺大的.像什么 "本手.妙手.俗手",光是看到这几个字我就头疼,更别提围绕这些去写篇文章了. 既然我写不 ...

  5. AI 写的高考作文,你打几分?

    又是一年高考时,高考真的是人生的一件大事,毕业这么多年,每次看到高考相关信息,还是会不由自主的点进来,其中语文的作文是每年大伙津津乐道的话题. 树先生今天就收到了某条小秘书的[邀请函],邀请参与「20 ...

  6. 《鲁迅全集》为何能成为传世之作?

    <鲁迅全集>为何能成为传世之作?   梧桐树边羽 2019-08 书 鲁迅是民国时期非常著名的大学者之一,但他与其他国学大佬又有些不一样,他除了做学问,搞创作,还是一位现实主义思想家.我们 ...

  7. 会写高考作文的AI,内含17亿参数、2亿数据、1万行代码

    点上方蓝字计算机视觉联盟获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:学术头条 AI博士笔记系列推荐 周志华<机器学习> ...

  8. Pytorch+LSTM+AI自动写诗实战

    文章目录 1.数据集和任务定义 2.读取数据集 3.数据预处理 4.数据制作 5.定义网络结构: 6.测试网络 7.可视化 8.总结 1.数据集和任务定义 本次采用的是唐诗数据集,一共有接近60000 ...

  9. AI也能写高考作文?我们用清华刚刚开源的「九歌」试了试

    晓查 郭一璞 发自 凹非寺 量子位 报道 | 公众号 QbitAI 今天是高考第一天,我猜,你一定在看全国各地那些奇奇怪怪的高考作文题,还要纠结一下: 这题目,该怎么写? 那,写不出来不如扔给AI,看 ...

最新文章

  1. 中国式安全感:2亿视频监控镜头守护社会生活
  2. centos7 安装无线工具包wireless-tools 包含 iwlist,iwconfig命令
  3. android frida 检测_frida测试方法整理
  4. maskrcnn还可以加网络吗_桃子加蜂蜜可以榨汁吗?桃子和蜂蜜可以一起吃吗?原来可以这样吃...
  5. 因为缺少xs-security.json文件导致的部署错误
  6. navicat导出数据到oracle,使用Navicat premium导出oracle数据库中数据到SQL server2008数据库中...
  7. C#调用DLL文件时参数对应表
  8. 004-JQuery属性
  9. [VNC] 云服务器 Ubuntu 16.04 安装 gnome 桌面并配置 VNC
  10. 支持access的php框架,NginX友好的PHP框架
  11. 卡巴斯基激活试用方法
  12. 百度网盘——下载限速问题解决方案(油猴(Tampermonkey)+PanDownload网页版+IDM)
  13. 制作uefi的kali安装盘_制作 UD + EFI + PE + KALI 启动U盘
  14. Windows10系统旧电脑打包迁移新电脑
  15. java获取某年度有多少周_java获取一年共有多少周
  16. 常用的Web前端技术有哪些?如何入门?
  17. as 贪食蛇小游戏(一)
  18. [python爬虫]多进程爬取喜马拉雅音乐
  19. 机器学习日记Day4
  20. 当当网创始人李国庆宣布离开当当,投身区块链再创业

热门文章

  1. 云安全与我们未来的网络息息相关……
  2. 计算机机房建设监理,机房工程建设监理工作要点讲解
  3. 无人值守u盘安装linux,从U盘无人值守安装linux操作系统(纯实践笔记)
  4. nvidia:未找到命令
  5. Process finished with exit code -1073741819 (0xC0000005)
  6. python解释器pypy
  7. pytorch 中 logsoftmax 与 softmax的区别
  8. numpy.where用法详解,对2维数组判断解释的比较清楚的
  9. 随机选取字母c语言,菜鸟求助,写一个随机输出26个英文字母的程序
  10. 图灵奖得主门徒、RISC-V 创始成员领衔,睿思芯科获数千万美金融资 | AI 创业周报第6期...