本文授权转载自学术头条

作者:赵雅琦

前段时间,浙江高考满分作文《生活在树上》因为晦涩难懂的内容,刷爆了各种社交媒体。外行人看热闹,内行人看门道,大神们透过现象看本质。

一般来说,高考作文可以通过批量化、模式化的训练达到一个令人满意的分数。实际上就是把学生当做一个写作机器进行训练,为学生输入大量范文,提供写作模式,然后进行长时间的学习。等等,这不是和人工智能的训练过程相同吗?

那么,如果给一个人工智能系统同样的数据,是否可以教会它写作文呢?

答案是,当然可以。B 站 UP 主 - 图灵的猫,秉承了心动不如行动的理念,一个人利用三个月,500 个小时,10000 行代码,200000000 条数据,1700000000 个参数,开发了一个会写作文的人工智能 - EssayKiller。

EssayKiller 的基本组成

一个 AI 不管外形和功能如何,其核心都是人工神经网络。EssayKiller 也是由四个不同的神经网络所组成。

第一部分是类似于人类的视觉处理系统的识别网络。它通过外接摄像头的实时 OCR 以及卷积神经网络及汉字的识别与提取并将结果输入到下一层的网络中。

第二部分是语言网络,旨在模范人类大脑的语言功能。在这里 UP 主将它分为两个子网络,相较于人类的颞叶区和额叶区等复杂构成,它更加简明扼要。一个子网络为读题网络,也就是对高考题目进行准确的阅读和主题摘要提取。

另一个子网络为写作网络,也就是根据主题摘要进行文章的写作。后者是整个 AI 的核心,基于这个神经网络,EssayKiller 才能获得理解并输出汉字的能力。

第三部分是判分网络。正常学生写完一篇八百字的高考作文通常需要 40 分钟,而 EssayKiller 只需要 0.1 分钟。显然,在同样的时间里,EssayKiller 可以利用其快速写作的能力,在它的大脑中同时生成多篇作文,然后选出最好的一篇来作答。

UP 主说,这个想法借鉴了 AlphaGo 的设计理念。他利用 API 调用单独的神经网络,对 100 篇作文进行通顺度打分,取分数最高的一篇作文输出。理论上,只要了解于出题人的偏好,并且让 AI 完美拟合阅卷人喜欢的作文,就可以轻而易举的拿到高分。

这和训练学生写高考作文的过程是如出一辙,这也是近年来很多满分作文的套路,比如《生活在树上》。

EssayKiller 的学习过程

通过 UP 主说起来看似很简单,其实非大神一操作就跪拜的四大网络搭建过程后,EssayKiller 就算是出生了。此时的它还是一张白纸,需要投喂大量数据养成。俗话说,读万卷书 AI 才能写出好作文。

接下来就是 EssayKiller 不是很漫长的学习过程了。UP 给它投喂了大量的优质散文、议论文,比如近现代散文集、历年高考作文等,然后让它自我训练并进行写作能力的提升。出于 UP 主的个人喜好,还为它增加了林语堂、木心、鲁迅等散文作家,也加入了一些现代作家,比如王小波、史铁生、王硕等。

最后通过整理来的 360 万张图像数据、2 亿条中文预训练语料以及上千篇微调文章,EssayKiller 带着 UP 主满满的爱开始了它的 “漫漫” 求学之路。

事实证明,没有人能够随随便便成功。此时,出现了一个 “愉快” 的小插曲。OOM,全称 “Out of Memory”,翻译成中文就是 “内存用完了。”

EssayKiller 的神经网络参数量已经达到了惊人的 17 亿,一般的显卡已经不能承受这么大的网络规模和计算量。在 UP 主多次尝试,均属失败告终后,他终于发现,EssayKiller 已经超越了目前市面上可见的任何一个单 GPU 的运算内存限制。最终,UP 主斥巨资选择 RTX8000,成功的让 EssayKiller 开始训练。果然,培养孩子都是得花钱的。

经过 137 个小时的不间断学习后,EssayKiller 终于成为一个合格的高中生。接下来就是激动人心的测试时间。UP 主选择了两个全国卷和两个地区高考卷。EssayKiller 用它骄傲和自豪的 17 亿神经网络参数的多模块异构深度神经网络,通过 UP 主编写的高考格式排版脚本,搭配改装后的外接装置,对文本进行实时输出,在规定时间内将作文誊写到答题卡上。最终贡献了四篇很不错的高考作文。(写作过程如开头眼花缭乱的动图。)

小编选择了浙江卷的作文成果,为大家展示一下 EssayKiller 的写作实力。

(为了方便阅读,对截图进行了裁减。文章以右侧为准。)

没错,是高考作文那熟悉的味道。别的先不说,感觉可能会扣一点卷面分。网友们普遍认为,差不多是 45 分的水平。首先语言是通顺的且能读懂的,但是缺少一些烟火气的灵魂。大概还是可以感觉到一丝不是人的气息。

但是小编认为,其实我们已经先入为主了这篇文章是 AI 写的,如果让大家盲选,结果如何还是很难判断的。

此外,也有热心网友提供了新的思路:写机关公文文件,难度会更小,且效果会更好。

还有热心网友提供了:AI 做视频,“我淘汰我自己” 的绝妙思路。

既然如此,那就拭目以待各位大神的新产品了。当然,暂时并不希望出现一款写公众号的 AI,不然小编就要失业了。

最后指路:

B 站视频链接:

https://www.bilibili.com/video/BV1pr4y1w7uM

项目 github 传送门:

https://github.com/EssayKillerBrain/EssayKiller_V2

最最后,感谢 UP 主 - 图灵的猫三个月爆肝的 EssayKiller,并期待新的视频与大家分享。

本文报道已获 UP 主 “图灵的猫” 授权。

逛逛GitHub交流群已成立
公众号运营至今,离不开小伙伴们的支持。为了给小伙伴们提供一个互相交流的平台,特地开通了逛逛GitHub官方交流群。需要进群的朋友,可长按扫描下方二维码加我微信 focusoncode,备注 进群, 交流群二维码在我的朋友圈推荐阅读
1. 基于 SSM 的分布式敏捷开发系统架构
2. 这个 72k Star 的 GitHub 项目被封了
3. 你会在 GitHub上面找项目吗?
4. 漫画:为什么C语言永不过时?喜欢文章,点个在看

太牛了!B 站 UP 主开发会写高考作文的 AI相关推荐

  1. 太牛了!3年Android开发工程师面试经验分享,跳槽薪资翻倍

    开头 眼看着金九银十就快来了,各大厂也开始了新一轮的招聘计划,尤其是腾讯前一段时间爆出了一个大消息: 将正式启动2021届秋季招聘,加大对数字经济和产业互联网人才的挖掘培养. 在本次招聘中,特别面向2 ...

  2. 太牛了!B站up主用AI分析,跨年演唱会上这些歌手假唱了!

    机器之心报道 编辑:泽南.蛋酱 世界上怕就怕「认真」二字. 唱功和音色是衡量歌手能力的重要标准,但观众对演唱技巧的评价见仁见智,既会因为喜好不够客观,又不时会遇到调音与假唱.所以很长一段时间里说到比较 ...

  3. 这个B站up主太硬核了!纯手工打造AI小电视:硬件自己焊接,驱动代码全手写...

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 晓查 发自 凹非寺  本文转自自:量子位(QbitAI) 一个低调的 ...

  4. 纯手工打造AI小电视,这个B站up主太硬核了!硬件自己焊接,驱动代码全手写...

    点击上方"码农突围",马上关注 这里是码农充电第一站,回复"666",获取一份专属大礼包 真爱,请设置"星标"或点个"在看&quo ...

  5. 同济子豪兄github_【B站UP主-同济子豪兄】华为云ModelArts零代码开发病虫害识别应用...

    大家好,我是B站UP主同济子豪兄,我希望让人工智能和大数据赋能每一个行业,每一个人. 今天给大家带来的是使用ModelArts快速开发农作物病虫害识别微信小程序,用人工智能的力量赋能农业,助力乡村振兴 ...

  6. 一场B站服务端开发面试之旅

    作者 | 蓝 来源 | 我是程序员小贱(ID:Lanj1995Q) 此次B站服务端开发面试之旅可谓惊险,不过通过对大部分面试题套路的掌握,不出意外还是拿下了,下面我们来看看这些题是不是常见的不能再常见 ...

  7. B站up主硬核打造「螃蟹火星车」,遥控、拍照、测距,还能做人脸检测;网友:赛博螃克...

    鱼羊 白交 发自 凹非寺 量子位 报道 | 公众号 QbitAI 吃完的螃蟹壳是干垃圾还是湿垃圾? 或者,裹上一层黑科技,让它变身「火星车」,馋哭隔壁家小孩. 更硬核的是,这样一台螃蟹火星车,并非只是 ...

  8. 故事分享|B站up主的感悟:粉丝从0到1.4万,我做对了什么?

    命定邂逅-与Python的"情投意合" 我是一名眼科医学的研究生,同时,我也是一名拥有1.4万粉丝的B站UP主. 研究生备考期间,我常常会利用休息时间去搜集一些和自己喜欢的歌手相关 ...

  9. 京东搜索框的汉语分词技术太牛了!!!---------js的番外拓展 (二)

    系列文章目录 JS的垃圾回收机制-----------------------------js的番外拓展 (一) https://blog.csdn.net/weixin_44070254/artic ...

  10. 5g局域网传输速度_这个路由太牛了吧?,三步搭建局域网,接上U盘就是NAS

    前言:哈喽大家好,我是伟华,之前一直特别的苦恼就是家里的网络不好.我家是传统的90平米的老式住宅,优点是过去的房子都很结实,但是有一个不好的地方就是墙壁的厚度太好了,容易挡住Wi-Fi信号.今年行业不 ...

最新文章

  1. 百度投资创维10亿,联手构建智能家居AI生态
  2. 图解 Attention(完整版)!
  3. ORM 一对一 以及csrf 的简单用法
  4. android5.1 init对rc文件解析执行顺序
  5. CSS学习18之小试牛刀
  6. Eclipse——WindowBuilder插件
  7. Linux基础学习六:Nginx的使用教程
  8. opencv 膨胀_【3】OpenCV图像处理模块(5)更多的形态学变换(开、闭、形态梯度、顶帽、黑帽)...
  9. 兴图视频指挥系统如何配置服务器,兴图新科指挥调度终端
  10. 苹果6s最大屏幕尺寸_iPhone12来了,我决定给老苹果升级一下电池_电池
  11. 大牛讲解Kubernetes实战
  12. java 线程安全 计数_java – 实现线程安全共享计数器的功能方法
  13. Ubuntu 为普通用户添加sudo权限
  14. 【资源汇总】超全整理深度学习相关学习资料,提供系统化的深度学习路径
  15. 02、RS485 通信与 Modbus 协议
  16. 转载-SAP HCM系统和OA系统接口方案讨论
  17. 视频和视频帧:视频和帧基础知识整理
  18. 建网站怎么选合适的网站模版
  19. Xmind教程:思维导图原来这么简单实用!
  20. 云计算基础-基本概念(一)

热门文章

  1. Windows路由表的灵异事件
  2. 100以内的平方数记忆法
  3. 站控层系统的服务器,干货|不知道智能变电站体系结构 你会错过很多事!
  4. 网络安全思维导图(全套11张)
  5. web前端开发分享-css,js进阶篇
  6. dcx游走 - 组合计数
  7. java开发一款推箱子游戏
  8. 关于计算机论文摘要和引言,论文摘要和背景的区别_论文前言与摘要的区别_引言和摘要有什么区别...
  9. 自制typora主题
  10. Android设备刷Device-owner说明