点上方蓝字计算机视觉联盟获取更多干货

在右上方 ··· 设为星标 ★,与你不见不散

仅作学术分享,不代表本公众号立场,侵权联系删除

转载于:学术头条

AI博士笔记系列推荐

周志华《机器学习》手推笔记正式开源!可打印版本附pdf下载链接

前段时间,浙江高考满分作文《生活在树上》因为晦涩难懂的内容,刷爆了各种社交媒体。外行人看热闹,内行人看门道,大神们透过现象看本质。

一般来说,高考作文可以通过批量化、模式化的训练达到一个令人满意的分数。实际上就是把学生当做一个写作机器进行训练,为学生输入大量范文,提供写作模式,然后进行长时间的学习。等等,这不是和人工智能的训练过程相同吗?

那么,如果给一个人工智能系统同样的数据,是否可以教会它写作文呢?

答案是,当然可以。

B 站 UP 主 - 图灵的猫,秉承了心动不如行动的理念,一个人利用三个月,500 个小时,10000 行代码,200000000 条数据,1700000000 个参数,开发了一个会写作文的人工智能 - EssayKiller。

EssayKiller 的基本组成

整体框架:

一个 AI 不管外形和功能如何,其核心都是人工神经网络。

EssayKiller 也是由四个不同的神经网络所组成。

第一部分是类似于人类的视觉处理系统的识别网络。它通过外接摄像头的实时 OCR 以及卷积神经网络及汉字的识别与提取并将结果输入到下一层的网络中。

第二部分是语言网络,旨在模范人类大脑的语言功能。在这里 UP 主将它分为两个子网络,相较于人类的颞叶区和额叶区等复杂构成,它更加简明扼要。一个子网络为读题网络,也就是对高考题目进行准确的阅读和主题摘要提取。

另一个子网络为写作网络,也就是根据主题摘要进行文章的写作。后者是整个 AI 的核心,基于这个神经网络,EssayKiller 才能获得理解并输出汉字的能力。

第三部分是判分网络。正常学生写完一篇八百字的高考作文通常需要 40 分钟,而 EssayKiller 只需要 0.1 分钟。

显然,在同样的时间里,EssayKiller 可以利用其快速写作的能力,在它的大脑中同时生成多篇作文,然后选出最好的一篇来作答。

UP 主说,这个想法借鉴了 AlphaGo 的设计理念。他利用 API 调用单独的神经网络,对 100 篇作文进行通顺度打分,取分数最高的一篇作文输出。理论上,只要了解于出题人的偏好,并且让 AI 完美拟合阅卷人喜欢的作文,就可以轻而易举的拿到高分。

这和训练学生写高考作文的过程是如出一辙,这也是近年来很多满分作文的套路,比如《生活在树上》。

EssayKiller的学习过程

通过 UP 主说起来看似很简单,其实非大神一操作就跪拜的四大网络搭建过程后,EssayKiller 就算是出生了。此时的它还是一张白纸,需要投喂大量数据养成。俗话说,读万卷书 AI 才能写出好作文。

接下来就是 EssayKiller 不是很漫长的学习过程了。UP 给它投喂了大量的优质散文、议论文,比如近现代散文集、历年高考作文等,然后让它自我训练并进行写作能力的提升。出于 UP 主的个人喜好,还为它增加了林语堂、木心、鲁迅等散文作家,也加入了一些现代作家,比如王小波、史铁生、王硕等。

也加入了一些现代作家,比如王小波、史铁生、王硕等。

最后通过整理来的 360 万张图像数据、2 亿条中文预训练语料以及上千篇微调文章,EssayKiller 带着 UP 主满满的爱开始了它的“漫漫”求学之路。

事实证明,没有人能够随随便便成功。此时,出现了一个 “愉快” 的小插曲。OOM,全称 “Out of Memory”,翻译成中文就是“内存用完了。”

EssayKiller 的神经网络参数量已经达到了惊人的 17 亿,一般的显卡已经不能承受这么大的网络规模和计算量。在 UP 主多次尝试,均属失败告终后,他终于发现,EssayKiller 已经超越了目前市面上可见的任何一个单 GPU 的运算内存限制。最终,UP 主斥巨资选择 RTX8000,成功的让 EssayKiller 开始训练。果然,培养孩子都是得花钱的。

经过 137 个小时的不间断学习后,EssayKiller 终于成为一个合格的高中生。接下来就是激动人心的测试时间。UP 主选择了两个全国卷和两个地区高考卷。

EssayKiller 用它骄傲和自豪的 17 亿神经网络参数的多模块异构深度神经网络,通过 UP 主编写的高考格式排版脚本,搭配改装后的外接装置,对文本进行实时输出,在规定时间内将作文誊写到答题卡上。

最终贡献了四篇很不错的高考作文。(写作过程如开头眼花缭乱的动图。)

这里选择浙江卷的作文成果,

为大家展示一下 EssayKiller 的写作实力。

没错,是高考作文那熟悉的味道。别的先不说,感觉可能会扣一点卷面分。网友们普遍认为,差不多是 45 分的水平。首先语言是通顺的且能读懂的,但是缺少一些烟火气的灵魂。大概还是可以感觉到一丝不是人的气息。

但是小编认为,其实我们已经先入为主了这篇文章是 AI 写的,如果让大家盲选,结果如何还是很难判断的。

此外,也有热心网友提供了新的思路:写机关公文文件,难度会更小,且效果会更好。

更有网友提到了用这个软件写成功学已经月入百万了,听懂掌声

还有热心网友提供了:AI 做视频,“我淘汰我自己”的绝妙思路。

既然如此,那就拭目以待各位大神的新产品了。当然,暂时并不希望出现一款写公众号的 AI,不然某人就要失业了。

end

这是我的私人微信,还有少量坑位,可与相关学者研究人员交流学习 

目前开设有人工智能、机器学习、计算机视觉、自动驾驶(含SLAM)、Python、求职面经、综合交流群扫描添加CV联盟微信拉你进群,备注:CV联盟

王博的公众号,欢迎关注,干货多多

王博的系列手推笔记(附高清PDF下载):

博士笔记 | 周志华《机器学习》手推笔记第一章思维导图

博士笔记 | 周志华《机器学习》手推笔记第二章“模型评估与选择”

博士笔记 | 周志华《机器学习》手推笔记第三章“线性模型”

博士笔记 | 周志华《机器学习》手推笔记第四章“决策树”

博士笔记 | 周志华《机器学习》手推笔记第五章“神经网络”

博士笔记 | 周志华《机器学习》手推笔记第六章支持向量机(上)

博士笔记 | 周志华《机器学习》手推笔记第六章支持向量机(下)

博士笔记 | 周志华《机器学习》手推笔记第七章贝叶斯分类(上)

博士笔记 | 周志华《机器学习》手推笔记第七章贝叶斯分类(下)

博士笔记 | 周志华《机器学习》手推笔记第八章(上)

博士笔记 | 周志华《机器学习》手推笔记第八章(下)

博士笔记 | 周志华《机器学习》手推笔记第九章

点个在看支持一下吧

会写高考作文的AI,内含17亿参数、2亿数据、1万行代码相关推荐

  1. ChatGPT写高考作文-《故事的力量》

    ChatGPT写高考作文-<故事的力量> 文章目录 ChatGPT写高考作文-<故事的力量> 1.题目 2.ChatGPT创作文章 1.题目 新课标I卷 试题内容: 阅读下面的 ...

  2. AI也能写高考作文?我们用清华刚刚开源的「九歌」试了试

    晓查 郭一璞 发自 凹非寺 量子位 报道 | 公众号 QbitAI 今天是高考第一天,我猜,你一定在看全国各地那些奇奇怪怪的高考作文题,还要纠结一下: 这题目,该怎么写? 那,写不出来不如扔给AI,看 ...

  3. 如果让 AI 来写高考作文,能得多少分?

    大家好,我是树义. 不知不觉,这两天又是高考的时候.距离我高考已经过去了整整 12 个年头了,想想那时候智能手机也不怎么普及,不像现在那样人手一个智能机. 现在不仅信息技术发达,人工智能技术也是突飞猛 ...

  4. ChatGpt写高考作文——2023北京卷

    题目一: "续航"一词,原指连续航行,今天在使用中被赋予了新的含义,如为青春续航.科技为经济发展续航等. 请以"续航"为题目,写一篇议论文. 要求:论点明确,论 ...

  5. 用GhatGPT写高考作文——2023全国甲卷

    题目: 人们因技术发展得以更好地掌控时间,但也有人因此成了时间的仆人. 这句话引发了你怎样的联想与思考?请写一篇文章. 要求:选准角度,确定立意,明确文体,自拟标题:不要套作,不得抄袭:不得泄露个人信 ...

  6. python 写数值模拟器_python实现模拟器爬取抖音评论数据的示例代码

    目标: 由于之前和朋友聊到抖音评论的爬虫,demo做出来之后一直没整理,最近时间充裕后,在这里做个笔记. 提示:大体思路 通过fiddle + app模拟器进行抖音抓包,使用python进行数据整理 ...

  7. 人工智能再次参加高考:和作家比写作文,AI能打多少分?

    继去年人工智能机器人"准星AI-MATHS"首次公开挑战高考数学考试后,人工智能再次与众多高考生一起走进考场,这次挑战的是高考作文. 据悉,这次参加挑战的高考机器人,将在今年的高考 ...

  8. 飞桨文心大模型挑战高考作文:平均1秒生成1篇,水平超75%考生

    本文已在飞桨公众号发布,查看请戳链接: 飞桨文心大模型挑战高考作文:平均1秒生成1篇,水平超75%考生 全国高考正在进行中,百度AI技术也迎来一场"高考".6月7日,百度数字人度晓 ...

  9. 把毛选和鲁迅全集喂给AI后,写出来的高考作文太对味了

    明敏 萧箫 发自 凹非寺 量子位 报道 | 公众号 QbitAI 高考刚过去不久,就有AI来"挑事"了. 这不,有个AI读完了毛选和鲁迅全集后,大笔一挥,写下好几篇高考作文. 结果 ...

最新文章

  1. 不得不提的团队协作工具
  2. c语言学习之基础知识点介绍(十二):结构体的介绍
  3. 学习XML(添加一个子节点) 摘录
  4. 使用 NuGet 管理我们的程序集 - 预发行版
  5. Python re 模块中,如何使用反斜杠 “\“分割字符串?
  6. 7-19晚牛客网刷题未知点、错题 集合
  7. C#:ref和out的联系及区别。
  8. java图片查看器下载_java照片查看器源代码
  9. 公链项目 Taraxa 已开启公募 KYC,投资者可在 3 月 12 日申购
  10. TensorFlow——如何查看当前版本TF编译使用的CUDA和cuDNN的编译版本
  11. java架构师是做什么的 java架构师的工作内容
  12. java请假系统毕业设计_基于java员工请假销假系统的设计与实现.doc
  13. 支付接口申请_微信小程序商城如何开通支付功能
  14. 【逻辑漏洞】短信轰炸
  15. lua invalid pattern capture
  16. 计算机考研自我介绍大概多少字,1分钟自我介绍大概多少字
  17. iOS 获取指南针的数据
  18. AutoDL论文解读(五):可微分方法的NAS
  19. 线程生命周期及六种状态
  20. Tomcat 7.0安装与配置

热门文章

  1. mysql锁与程序锁_sql 锁类型与锁机制
  2. html5设置data,HTML5自定义data属性
  3. 80C51汇编语言有哪几条常用伪指令,单片微机原理与接口技术答案(宋跃版)
  4. python wms_webGIS实践:4_2_python django整合geoserver wms服务
  5. 杂志订阅管理系统c++_有哪些值得收藏的室内设计杂志?
  6. 宝塔可以修改服务器内存限制吗,宝塔内存使用率很高的解决方法 cpu过高这样做!...
  7. 索引体积_米家温湿度计体积虽小,耗电不小,如果经常离线,换颗电池吧
  8. 升级无法登录_JeeSite v4.2.2 发布,代码生成增强、Boot 2.3、短信登录、性能提升...
  9. java flv转mp3_【转载】音频视频转化工具JAVE(ffmpeg的Java封装)
  10. 显示和隐藏菜单栏(两种方式div、table)