视学算法报道

转载自:机器之心

编辑:陈萍、杜伟

GPT-3 写的论文及格了吗?教育资源网站 EduRef 对此进行了一项测试,效果还行,及格水平。

2020 年 5 月,OpenAI 推出了具有 1750 亿参数的史上最大 AI 模型 GPT-3,该模型不仅可以更好地答题、翻译、写文章,还带有一些数学计算的能力。自推出以来,该模型就开始在不同的领域大显身手,如基于问题的搜索引擎、与历史人物对话、基于文本描述生成代码以及绘图和图像补全等等。

但 GPT-3 的应用之路远未结束…

近日,教育资源网站 EduRef 进行了一项测试,他们找了一组教授创建了一个写作提示,然后让应届毕业生和本科生以及 GPT-3 同时根据该提示写作,最后教授组对匿名提交的作文打分,并对作者进行追踪调查。那么,究竟结果如何呢?GPT-3 的分数能够超过人类作者吗?未必!

GPT-3 通过了大部分课程的写作测试

常言道:「评级为 C 就可以毕业(C’s get degrees)」。AI 远远达不到完美,GPT-3 的写作水平大概相当于自由写作者(freelance writer)。

结果显示,在 COVID-19 疫苗效力的研究方法论文写作上,人类作者可以得到 B 或者 D,而 GPT-3 往往只能得到 C。在美国历史类的测试中,人类作者可以在美国例外主义论文中得到 B 或者 C+,而 GPT-3 只能得到 B-。最后,在法学课上的政策函写作中,GPT-3 得到了 B-,而 3 个学生中只有 1 个能够得到高分。

下图为人类作者与 GPT-3 在不同学科写作中的得分情况:

由此可见,GPT-3 的写作技能主要体现在技术类文档中。在创意写作课程中的地点记叙文(place narrative)写作中,GPT-3 仅得到了 F,没有通过测试。作为对比,自由写作者得到了 A、B + 和 D+。尽管在创意写作教授的眼中,GPT-3 失败了,但自然语言生成(NLG)软件依然可以用于编写各类内容,包括一部几乎获奖的小说《The Day a Computer Writes a Novel》。先前的成功也预示着以后的失败,GPT-3 或许只需要一些调整即可以成为一名合格的创意作家。总的来说,AI 几乎通过了所有的课程写作测试

GPT-3 20 分钟完成论文

虽然每个教授打分都不一样,但该评分小组包括两名博士和一名医学硕士。他们总共有超过 55 年的高中和各种大学水平的教学经验。写作者包括应届毕业生和本科生,其中一些人在他们的研究领域写了提示。平均来说,他们需要 3 天时间完成任务。

对于绝大多数学生来说,3 天内完成大学论文似乎是很难的事情,主要原因在于时间太短,但是 GPT-3 在 20 分钟内就完成了这个任务。GPT-3 利用深度学习产生类似人类的文本,每项任务花费 3 到 20 分钟完成,并且用最长的时间来编写创造性的写作叙述。为了避免人为干扰,GPT-3 只对输出长度和重复文本进行了轻微的编辑,其生成的内容、真实信息和语法都没有受到影响。

GPT-3 生成的美国历史类作文示例如下:

GPT-3 可生成类似人类写作的内容

即使没有人为干扰,GPT-3 的任务也或多或少地收到了与人类作者相同的反馈。49.2% 的评论涉及语法和句法,26.2% 的评论涉及重点和细节,语气与行文结构等也被提及,但分别只有 12.3% 和 10.8%。这与人类作家收到的评论比例几乎相同,近 50% 的评论与语法和句法有关,25.4% 的评论与焦点和细节有关。超过 13% 的评论是关于人类专业知识,而 10.4% 的评论是关于整体风格等。

人类作者与 GPT-3 的写作结果收到的评论反馈情况:

尽管收到了同样风格的评论,GPT-3 生成的内容与人类作者并不那么相似。以排名靠前的两个单词组合为例,GPT-3 和人类作者只分享了排名靠前的组合:「of the」。「People who」、「it is」和「those who」常被 GPT-3 使用,而人类作者经常使用的是「to the」、「in the」和「on the」。总体来说,这些单词是在英语中经常使用的,组合上的差异显示出 AI 和人类在写作结构上的一些差异。

人类作者与 GPT-3 在写作用词上的差异分析:

考虑到 GPT-3 超高的论文得分,搭配统计数据的差异表明,人类作者比 AI 产生的独特内容明显更多。

尽管 GPT-3 具有出色的产出,但其生成的论文在短期内还无法独立获得大学学位。当与人类作者竞争时,GPT-3 获得了一些及格分数,但在创意写作方面有所欠缺。尽管它在众多领域的成功为 AI 的未来带来了希望,但对大学教授来说,AI 依然存在不足。

原文链接:https://www.eduref.net/features/what-grades-can-ai-get-in-college/

© THE END

转载请联系机器之心公众号获得授权

投稿或寻求报道:content@jiqizhixin.com

点个在看 paper不断!

除了缺少点创意,GPT-3写出了及格的大学毕业论文,只需20分钟相关推荐

  1. 除了缺点创意,GPT-3写出了及格大学毕业论文,只需20分钟

    GPT-3 写的论文及格了吗?教育资源网站 EduRef 对此进行了一项测试,效果还行,及格水平. 2020 年 5 月,OpenAI 推出了具有 1750 亿参数的史上最大 AI 模型GPT-3,该 ...

  2. python代码怎么写出色_如何写出更具有Python风格的代码,五分钟教会你!

    我们都喜欢 Python,因为它让编程和理解变的更为简单.但是一不小心,我们就会忽略规则,以非 Pythonic 方式编写一堆垃圾代码,从而浪费 Python 这个出色的语言赋予我们的优雅.Pytho ...

  3. 职场神器:只需三分钟,让ChatGPT帮我写周报

    说到周报,尽管周报的目的是为了提高团队合作和项目进展的透明度,但很多职场员工都觉得是件麻烦事. 本来忙碌了一周到周五的下午,工作完成了,可以下班去吃饭,去嗨皮了,结果临走前还得写一份"每周工 ...

  4. C#--如何用字符串组成的逻辑表达式进行判断,如:“7>2(4<7||8>4)“,字符串写的逻辑表达式来进行判断(只需3步)

    阅前须知 C# ,此篇主要讲讲逻辑,逻辑学会,其他语音都是一样的: DataTable ,DataTable是 ADO.NET 库中的中心对象.: 实际项目需求分析 在做项目时,我们会在数据库中某一张 ...

  5. 每天只需15分钟!情感励志视频剪辑一天200多,不用真人出镜

    大周之前的内容有跟大家分享过情感励志类的视频应该怎样去剪辑. 今天大周在来给小伙伴们分享一种情感励志类视频的另一种表现形式,大周学员前天的一个视频的已经有15w的播放量. 如果按照现在最低的单价来算的 ...

  6. 代码规范、如何写出好代码

    转载请注明出处: http://blog.csdn.net/gane_cheng/article/details/52152497 http://www.ganecheng.tech/blog/521 ...

  7. 技术人员和非技术人员如何写出优质博客?-涵子的个人想法

    大家好,我是涵子.今天,我们来沉重的聊聊一个大家都很关心的一个问题:技术人员和非技术人员如何写出优质博客? 目录 前言 初写博客,仰望大师 中段时期,无粉无赞 优质博客,涨粉涨赞 优质内容从何而来 优 ...

  8. 视频:KUKA机器人秒杀画家 绘出人物肖像只需三步骤

    随着科技的高速发展与智能化的出现,科学家越来越多地尝试运用机器来替代人工,KUKA机器人就是这类机器的代表.虽说计算机绘图仪已存在近30年,然而一款KUKA机器人(由德国卡尔斯鲁厄市艺术和媒体技术中心 ...

  9. 文案撰写技巧,4招写出高转化的创意文案!

    文案撰写技巧,4招写出高转化的创意文案! 阅读本文,你会get以下标题文案写作技能:损失规避心态.反差冲击.目标人物描述.行业典型代表. ▌现象与本质 在<神探夏洛克>中有一句经典台词:Y ...

最新文章

  1. python实现完全数
  2. 面试集锦(十六)架构设计
  3. 为什么ORM性能比iBATIS好?
  4. CUDA:根据本地电脑的NVIDIA显卡驱动版本去正确匹配待安装的CUDA版本之详细攻略
  5. Linux下利用backtrace追踪函数调用堆栈以及定位段错误
  6. ppp协议pap验证过程状态转移图_硬核分享|Crust 核心协议栈的设计与实现
  7. fiddler,他和其他抓包软件有什么区别,如何使用fiddler进行抓包
  8. 【Python学习】 - sklearn学习 - 评估指标precision_score的参数说明
  9. C/C++笔试题(基础题)
  10. 清空sql server数据库日志
  11. 输入字符_你会输入带圈字符吗?
  12. python opencv中的imwrite函数_python – OpenCV imwrite函数导致’undefined symbol’
  13. Qt之QPA(linuxfb 一)
  14. 缺少计算机所需的介质程序,win10系统UEFi安装提示“缺少计算机所需的介质驱动程序”的图文方案...
  15. python作排产计划_排产计划表
  16. 科技爱好者如何避免成为“民科”,以及为何科技爱好团体必须杜绝“民科”现象...
  17. 11月最新WIFI大师小程序源码/支持无限部署
  18. 【BUUCTF】[Zer0pts2020]Can you guess it?
  19. 【荧光光谱】用matlab绘制荧光光谱图
  20. 后台管理 vue+element 开源框架

热门文章

  1. 来自 Google 的 R 语言编码风格指南
  2. 世上最伟大的十个公式,1+1=2排名第七,质能方程排名第五
  3. 【组队学习】十二月微信图文索引
  4. 技术图文:如何利用BigOne的API制作自动化交易系统 -- 订单系统
  5. 【怎样写代码】参数化类型 -- 泛型(九):泛型代码中的default关键字
  6. 图像补运算:反色处理
  7. 鼠标按键获取感兴趣区域
  8. VMware15克隆虚拟机Centos
  9. 使用mysql内连接查询年龄_Mysql的连表查询
  10. 如何读取Excel表格中不同sheet表的同一位置单元格数据,并绘制条形图呢?