前段时间,浙江高考满分作文《生活在树上》因为晦涩难懂的内容,刷爆了各种社交媒体。外行人看热闹,内行人看门道,大神们透过现象看本质。

一般来说,高考作文可以通过批量化、模式化的训练达到一个令人满意的分数。实际上就是把学生当做一个写作机器进行训练,为学生输入大量范文,提供写作模式,然后进行长时间的学习。等等,这不是和人工智能的训练过程相同吗?

那么,如果给一个人工智能系统同样的数据,是否可以教会它写作文呢?

答案是,当然可以。B 站 UP 主 - 图灵的猫,秉承了心动不如行动的理念,一个人利用三个月,500 个小时,10000 行代码,200000000 条数据,1700000000 个参数,开发了一个会写作文的人工智能 - EssayKiller。

EssayKiller 的基本组成

一个 AI 不管外形和功能如何,其核心都是人工神经网络。EssayKiller 也是由四个不同的神经网络所组成。

第一部分是类似于人类的视觉处理系统的识别网络。它通过外接摄像头的实时 OCR 以及卷积神经网络及汉字的识别与提取并将结果输入到下一层的网络中。

第二部分是语言网络,旨在模范人类大脑的语言功能。在这里 UP 主将它分为两个子网络,相较于人类的颞叶区和额叶区等复杂构成,它更加简明扼要。一个子网络为读题网络,也就是对高考题目进行准确的阅读和主题摘要提取。

另一个子网络为写作网络,也就是根据主题摘要进行文章的写作。后者是整个 AI 的核心,基于这个神经网络,EssayKiller 才能获得理解并输出汉字的能力。

第三部分是判分网络。正常学生写完一篇八百字的高考作文通常需要 40 分钟,而 EssayKiller 只需要 0.1 分钟。显然,在同样的时间里,EssayKiller 可以利用其快速写作的能力,在它的大脑中同时生成多篇作文,然后选出最好的一篇来作答。

UP 主说,这个想法借鉴了 AlphaGo 的设计理念。他利用 API 调用单独的神经网络,对 100 篇作文进行通顺度打分,取分数最高的一篇作文输出。理论上,只要了解于出题人的偏好,并且让 AI 完美拟合阅卷人喜欢的作文,就可以轻而易举的拿到高分。

这和训练学生写高考作文的过程是如出一辙,这也是近年来很多满分作文的套路,比如《生活在树上》。

EssayKiller的学习过程

通过 UP 主说起来看似很简单,其实非大神一操作就跪拜的四大网络搭建过程后,EssayKiller 就算是出生了。此时的它还是一张白纸,需要投喂大量数据养成。俗话说,读万卷书 AI 才能写出好作文。

接下来就是 EssayKiller 不是很漫长的学习过程了。UP 给它投喂了大量的优质散文、议论文,比如近现代散文集、历年高考作文等,然后让它自我训练并进行写作能力的提升。出于 UP 主的个人喜好,还为它增加了林语堂、木心、鲁迅等散文作家,也加入了一些现代作家,比如王小波、史铁生、王硕等。

最后通过整理来的 360 万张图像数据、2 亿条中文预训练语料以及上千篇微调文章,EssayKiller 带着 UP 主满满的爱开始了它的“漫漫”求学之路。

事实证明,没有人能够随随便便成功。此时,出现了一个 “愉快” 的小插曲。OOM,全称 “Out of Memory”,翻译成中文就是“内存用完了。”

EssayKiller 的神经网络参数量已经达到了惊人的 17 亿,一般的显卡已经不能承受这么大的网络规模和计算量。在 UP 主多次尝试,均属失败告终后,他终于发现,EssayKiller 已经超越了目前市面上可见的任何一个单 GPU 的运算内存限制。最终,UP 主斥巨资选择 RTX8000,成功的让 EssayKiller 开始训练。果然,培养孩子都是得花钱的。

经过 137 个小时的不间断学习后,EssayKiller 终于成为一个合格的高中生。接下来就是激动人心的测试时间。UP 主选择了两个全国卷和两个地区高考卷。EssayKiller 用它骄傲和自豪的 17 亿神经网络参数的多模块异构深度神经网络,通过 UP 主编写的高考格式排版脚本,搭配改装后的外接装置,对文本进行实时输出,在规定时间内将作文誊写到答题卡上。最终贡献了四篇很不错的高考作文。(写作过程如开头眼花缭乱的动图。)

小编选择了浙江卷的作文成果,为大家展示一下 EssayKiller 的写作实力。

(为了方便阅读,对截图进行了裁减。文章以右侧为准。)

没错,是高考作文那熟悉的味道。别的先不说,感觉可能会扣一点卷面分。网友们普遍认为,差不多是 45 分的水平。首先语言是通顺的且能读懂的,但是缺少一些烟火气的灵魂。大概还是可以感觉到一丝不是人的气息。

但是小编认为,其实我们已经先入为主了这篇文章是 AI 写的,如果让大家盲选,结果如何还是很难判断的。

此外,也有热心网友提供了新的思路:写机关公文文件,难度会更小,且效果会更好。

还有热心网友提供了:AI 做视频,“我淘汰我自己”的绝妙思路。

既然如此,那就拭目以待各位大神的新产品了。当然,暂时并不希望出现一款写公众号的 AI,不然小编就要失业了。

最后指路:

B站视频链接:https://www.bilibili.com/video/BV1pr4y1w7uM

项目github传送门:https://github.com/EssayKillerBrain/EssayKiller_V2

爆肝100天,B站UP主开发会写高考作文的AI,内含17亿参数、2亿数据、1万行代码相关推荐

  1. B站UP主指法芬芳张大仙弹幕爬取及可视化

    文章目录 前言 一.爬取视频弹幕相关信息 1.B站弹幕接口 2.获取视频的cid 3.获取视频弹幕信息 二.弹幕数据可视化 1.弹幕内容可视化 -- 词云图 2.弹幕发送者可视化 -- 水平条形图 3 ...

  2. 「B站焊武帝」再出圈!孤身爆肝造CPU,软硬件全自研,可玩游戏,基础器件成本不到1000元...

    杨净 Pine 发自 凹非寺 量子位 | 公众号 QbitAI 两年时间,一个90后体制内小哥下班之后只干三件私务,那就是: 手搓CPU!手搓CPU!还是***手搓CPU! 纯手工制作.全自主研发,于 ...

  3. B站大佬用我的世界搞出卷积神经网络,LeCun转发!爆肝6个月,播放破百万

    丰色 发自 凹非寺 量子位 | 公众号 QbitAI 非计算机专业.神经网络小白,爆肝六个月-- 在<我的世界>里搭建一个卷积神经网络,这是什么神操作? ‍‍ 最近,来自B站up主@辰占鳌 ...

  4. LeCun大佬点赞转发!B站大佬爆肝6个月,目前播放量破百万!

    来源:量子位 非计算机专业.神经网络小白,爆肝六个月-- 在<我的世界>里搭建一个卷积神经网络,这是什么神操作? ‍‍ 最近,来自B站up主@辰占鳌头的作品着实火了一把. 他和朋友们合作完 ...

  5. 爆款制作获1200w播放,B站UP主+品牌如何迈入2023

    1月13日,bilibili 2022年度百大UP主已经揭开帷幕,今年延续2021年的评审标准,依然从专业性.影响力.创新性三个维度进行评选. 来源-B站 这套评审标准已经实施两年,早期的百大评选上榜 ...

  6. 焊武帝再爆肝造CPU,软硬件全自研,可玩游戏,基础器件成本不到1000元

    关注+星标公众号,不错过精彩内容 素材来源 | B站 直接来源 | 量子位 两年时间,一个90后体制内小哥下班之后只干三件私务,那就是: 手搓CPU!手搓CPU!还是***手搓CPU! 纯手工制作.全 ...

  7. 万字长文爆肝Python基础入门【巨详细,一学就会】

    目录 数据的名字和种类--变量和类型 初探数据种类 数据类型 数值运算 比较运算 变量和赋值 变量的好处 用赋值更新变量 变量和数据类型的关系 总结 数据类型 数值运算 数值比较 变量和赋值 一串数据 ...

  8. 26 岁年薪百万!华为最新“天才少年”曝光,学霸兼 B 站 UP 主,还爱跳街舞

    整理 | 朱珂欣 出品 | CSDN程序人生(ID:coder_life) 科技的浪潮之下,可谓是"得人才者得天下",各大厂.巨头公司们聚天下英才而用之,希望借此创造佳话,而华为就 ...

  9. 熬夜爆肝!C++基础入门大合集【万字干货预警 建议收藏】

    前言 前几天有粉丝问我,大一结束c++刚学完,不知道自己目前学得怎么样?要掌握的知识点有没有都弄懂了?是否基础入门了? 这就安排上,熬夜爆肝整理出来的C++基础入门知识! 一篇文带你入门C++!一篇文 ...

  10. Z世代偏爱怀旧IP,B站UP主不可忽视的流量蓝海

    导语 互联网信息时代下面对每天都会有大量信息涌入的B站,UP主.品牌如何重新利用"过去的流量"掀起新的流量热潮? 怀旧IP力挽流量低潮 奥特曼,数码宝贝,美少女战士等作品是伴随Z世 ...

最新文章

  1. golang实现生产者和消费者
  2. Linux压缩解压缩命令
  3. 《.NET应用架构设计:原则、模式与实践》新书博客--试读-1.1.2 架构师的职责
  4. 基于opencv在摄像头ubuntu根据视频获取
  5. day5-shutil模块
  6. android图片缩小和放大Matrix
  7. 软件架构(9)---架构视图
  8. inline-block,一个奇怪的问题:中间div掉下来
  9. anaconda 换源_Anaconda下安装tensorflow1.15过程记录
  10. 学习记录542@阿里云OCR身份证识别具体实现
  11. 2020.07-Study_update.5
  12. Centos6.3 安装rhythmbox播放器
  13. AutoCAD如何设置A0A1图纸
  14. 报错:UnicodeDecodeError:: ‘utf-8‘ codec can‘t decode byte 0xc8 in position 0: invalid contin
  15. html中重置居中单词是,HTML中的居中方法
  16. max232c语言,串行口通信(STC89C52+MAX232):串行口通信硬件设计详解
  17. errorcode 微信分享_微信公众号网页授权code问题
  18. 系统集成项目应怎样管?本文经验值得借鉴
  19. 降本提效!注册中心在蚂蚁集团的蜕变之路
  20. 开学季准备什么蓝牙耳机好?五款性价比高的蓝牙耳机品牌推荐

热门文章

  1. 计算机键盘有哪些作用,电脑键盘各个按键有哪些作用 电脑键盘各个按键作用介绍...
  2. 向日葵 远程开机 linux,教你使用向日葵开机棒轻松实现远程开机
  3. 如何学好游戏编程 二
  4. 中高级Android面试中你不得不会的知识点,3面直接拿到offer
  5. 数据结构实验 7-18 新浪微博热门话题 (30分)
  6. conda install Python库时报PackagesNotFoundError:的错误的解决方案
  7. Linux那些事儿之我是U盘(16)冰冻三尺非一日之寒
  8. imatest白平衡测试结果解析
  9. 工作中的会议纪要模板
  10. 风筝 vpn_风筝将其AI驱动的代码完成功能引入JavaScript