夏乙 舒石 发自 凹非寺
量子位 出品 | 公众号 QbitAI



你被机器批改过作业么?

最近,老外特别关注AI在中国教育界的进展,例如人脸识别进课堂、高中AI教材出版等等,这一次关注的焦点是:AI代替老师批作业。

起因是,英文媒体《南华早报》最近有篇报道[1]说,中国有大约6万所学校都在用人工智能来批改学生的作业,每四所学校中就有一所在用。

这些学校分布在各地,四川、山东、安徽、北京……

学生们提交的英文作业,打分交由机器完成,而不是人类教师。作文批改系统,要比Word的拼写检查复杂得多。它能够理解文字的一般逻辑和意思,对作文的整体质量做出像人一样合理的评判,还要在写作风格、结构、主题等方面给出改进建议。

据说,92%的情况下,AI和人类教师对一篇作文的评分是一致的。

这个笼罩6万所学校的人工智能,就是句酷批改网。在它的背后,是一个多所高校和公司共同推进了近10年的项目:语言智能评测关键技术及应用。

数据显示,这个机器教师的学生已经达到1.2亿,还覆盖了北京90%高校,以及所有区县的中学。但它也像一道分水岭,有些人压根没听过。这一点也不奇怪。要知道2016年底,这个服务覆盖的学校才6000多所。

也就是说,一年之间,它覆盖的学校数量增长了900%。

“高分秘籍”

学生对机器批改作业,感受如何?

一个可见的情况是,你能轻松从微博上找到各种吐槽。

比如:

“生活所有的痛苦都来自英语批改网和老师的公邮”



“受了批改网一肚子气”



“就像相信批改网是垃圾。即使在批改网的排名是倒数也不影响就是这样坚定地上交的决心”



说起这些,量子位的一枚同事,默默地贴出她被批改网“支配”的往事:100多字的英语短文,修改了40多次。



当人把命运交到机器手里,心中总是有点不服气。

于是不断有人试图证明,机器评分这套系统,不过尔尔。比如此前未来网就在报道[2]中提及此事。

网友“TroyS”反映,一次专门到网上查到批改网各种高分表达并且用到作文里,提交后得了86分,修改语法错误后分数变为91.5分。此后,该网友把“高分表达”删除,试着用普通表达后,评分还是91.5分。再后来,试着删掉最后一段、试着删掉最后两段,提交后的分数也都仍然是91.5分。但更令其吃惊的是,当该网友把最后两段又贴回去后,分数变成了90分,并且此后修改了17次之多,但分数没变过。

知乎网友“猴赛雷”也提到,通过使劲重复题目要求中的词和句子、贯穿全文,结构以“首先、其次”这类“八股文模式”照搬,文内多加六级高级词汇和句式等,再加上批改网推荐替换的词汇都用上,最后就能得到高分,但是内容驴唇不对马嘴。

未来网记者将网上找的《假如给我三天光明》的英文节选粘贴到批改网上,提交后得分85.5分,并提示标题“假如给我三天光明”的英文表达“疑似谓语缺失”。根据文后的按句点评修改两处提交后,得分仍为85.5分。然而,当记者删掉最后一段后,得分变为了86分。接着,记者又删除第一段,提交后得分变成了86.5分。当记者再将第二段删除后,分数又变成了86分。

总而言之一句话,机器批改作业,确实还有很多不完善的地方。

一位自称曾经是批改网研发的用户也表示,“批改网的批改原理是用多维度加权平均来给你打分。如果一个维度权重很重,你刚好改了之后这个维度的值降了,一加权自然就分数低了”。

“同学们加油,是机器就有漏洞,就看你们能不能总结出规律了。”

背后原理

机器到底是如何批改作业的?

在批改网的官方页面上,对于背后技术的阐释如下。

批改网的原理通过对比学生作文和标准语料库之间的距离,并通过一定的算法将之映射成分数和点评。

2014年多知网的一篇报道中[3],批改网创始人讲述了更多的细节。我们摘录如下。

批改网修改作文的原理是,作文提交后,网站将作文从“词汇”、“句子”、“篇章结构”、“内容相关度”4个大类192个维度进行拆分,每个维度都会与批改网建立的英语本族语语料库(即国外英语文章的素材)作对比。语料库越丰富,对比的客观性就越高,机器批改与人工批改的一致率就越高。

比如,在作文中经常出现“learn knowledge”这样的中式英语。将这样的语言搭配与语料库资料对比后发现,以英语为母语的国家中,使用“learn knowledge”的频率为0次,使用频率最高的是“have knowledge”。所以,会建议学生使用“have knowledge”。

再提供点新信息,根据《2018年国家科学技术进步奖项目提名公示》中披露的内容显示,批改网背后的技术“历经近10年的潜心研究”。

其中列出的五个主要的创新点包括:

1、首次提出全信息语言评测模型 2、构建大规模评测本体知识库 3、构建大规模评测语料库和规则库 4、提出篇章主题聚合度模型 5、提出文档自动编辑和转换模型。

大概就这样吧。

不管细节怎样,总有质疑说机器批改打分的价值不大,目前仍有一些不足云云。但是,这套系统可能真的击中了老师的痛点。官方也把这个作为宣传的重点:

老师们问什么要使用批改网呢?

上海交通大学的胡开宝教授说,批改网可以减轻老师负担,提高学生学习积极性;清华大学杨芳老师:”以前学生追着我问 ‘ 老师你改了没有? ‘ ,在使用批改网后我追着学生问 ‘ 作文交了没有?’ “。

系统的开发者们把它定位成一种辅助工具。对于缺乏教育资源的偏远地区学生来说,一个批改作文的AI能为他们带来不错的写作训练;对于一般的学校来说,它能帮老师们搞定堆积如山的作业,加快批改的速度。

然而根据《南华早报》的报道,老师们对作文批改AI的信任度并不是很高。老师们依然认为,这个系统还不能算完美,有些很好的作文得不到高分。

其实,在作文批改AI出现更早的美国,机器打分早已有了更大胆的应用。

测试机构ETS的作文评分系统e-rater,从2010年开始,就开始正式参与托福考试作文的打分,一个人类评分员和e-rater给出的分数一平均,就成了托福作文的得分。

而这次被英文媒体关注的中国批作业AI,老师们也只是在日常作业和小测验中使用AI来批改打分,真正的考试,还不敢交给它。

就酱。

[1] SCMP:China’s schools are quietly using AI to mark students’ essays … but do the robots make the grade?

http://www.scmp.com/news/china/society/article/2147833/chinas-schools-are-quietly-using-ai-mark-students-essays-do

[2] 未来网:批改网让学生不再质疑分数? 英文原著“打脸”智能批改实力

http://m.edu.k618.cn/ycbd/201801/t20180130_15146364.html

[3] 多知网:句酷批改网:用机器批改作文的创业故事

http://www.duozhi.com/company/20141124/2412.shtml

活动报名

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

1亿中国人已被AI批改过作业相关推荐

  1. 数学题 识别 批改 python_准确率99.9%!AI批改数学题,误判率仅为人工1/10,计算填空应用题都能批改...

    原标题:准确率99.9%!AI批改数学题,误判率仅为人工1/10,计算填空应用题都能批改 11月19日,猿辅导旗下小猿口算App宣布,目前小猿口算针对小学横式题目的AI批改准确率已经达到了99.9%, ...

  2. 预测|麦肯锡预测2030年:1亿中国人面临职业转换,全球8亿人被机器人取代

    来源:先进制造业 摘要:纵观人类技术的发展历程,往往遵循一个固定的规律,即先是概念萌芽,然后经历市场炒作,资本蜂拥,结果潮水退去,泡沫破灭.而繁华落尽后,才会经历技术成熟的阶段,直到最后的落地应用,人 ...

  3. 2030年,逾1亿中国人需要学习新技能并转换岗位,这就是摩擦性失业

    在自动化的浪潮中,全社会需要解决好四个问题:一是需要保持积极的稳健增长,以保证工作岗位的增加:二是提供工作培训机会,帮助个人学习适应市场需求的新技能:三是提高商业社会乃至劳动力市场的活力和流动性:四是 ...

  4. 准确率99.9%!小猿口算靠AI批改数学题,误判率仅为人工1/10,计算填空应用题都能批改...

    郭一璞 发自 望京凯悦 量子位 报道 | 公众号 QbitAI 11月19日,猿辅导旗下小猿口算App宣布,目前小猿口算针对小学横式题目的AI批改准确率已经达到了99.9%,超过了人类平均水平. &q ...

  5. AI批改英语作文行不行?免费,覆盖雅思考研四六级,打分评语纠错都得有 | 测评...

    茕茕 发自 凹非寺 量子位 报道 | 公众号 QbitAI 我,一个科技小编,最近在跟国外大佬的邮件交流中,感到飘过六级后的自己英语写作水平那真是日渐捉急. 从句怎么用?时态对不对?看着对面主编犀利的 ...

  6. 快手前AI核心人物李岩创业,已成立AI公司“元石科技”

    1.快手将于3月29日公布2022年第四季度及全年业绩 新榜讯 近日,快手科技宣布,将于2023年3月29日(星期三)在香港市场收市后公布其截至2022年12月31日第四季度及2022年全年业绩.公司 ...

  7. AI 一分钟 | 南京大学成立人工智能研究院;三星关联实体已收购 AI 搜索引擎创业公司Kngine的全部股份

    整理 | Leo 一分钟AI 三星关联实体已收购 AI 搜索引擎创业公司Kngine的全部股份 读心术 AI 不再是科幻,相关技术已开始起步 Youtube 利用AI 工具替代绿幕特效 南京大学成立人 ...

  8. ai作文批改_全球第一份机器人批改的作文 阿里AI批改中文试卷

    近日,浙江外国语学院国际学院,来自俄罗斯.韩国.赞比亚等6个国家的11位外国留学生完成了一份特别的中文试卷--看卷老师为来自阿里巴巴的人工智能. 在这批试卷上,阿里AI用代表不同意义的符号在试卷上,精 ...

  9. 把 14 亿中国人都拉到一个微信群,程序员在技术上能实现吗?

    点击蓝色"架构文摘"关注我哟 加个"星标",每天上午 09:25,干货推送! 根据国家统计局的数据,截至 2017 年末,中国大陆总人口为 13 亿 9008 ...

最新文章

  1. Linux Kernel TCP/IP Stack — 协议栈发包处理流程
  2. 滚动条判断是否滑动到顶部底部
  3. Android官方开发文档Training系列课程中文版:OpenGL绘图之图形绘制
  4. android获取小程序音频时长,微信小程序获取音频时长与实时获取播放进度
  5. 基于AgileEAS.NET企业应用平台实现基于SOA架构的应用整合方案-开篇
  6. JavaScript 之 截取字符串函数
  7. 【SDOI2014】数表
  8. 怎样进行云迁移 企业才不会后悔!
  9. Python的网络编程[5] - BOOTP + TFTP + FTP - 实现一个简单的文件传输流程
  10. 当 p<1时,p 范数不满足三角不等式的证明 | p norm | triangle inequality
  11. 一款用来下载pdf word zip img各种文件的js插件
  12. ActiveMQ下载与安装使用
  13. Linux复制文件到某路径并重命名
  14. PyTorch Geometric (PyG) 入门教程
  15. 写代码累了,读读这些书~
  16. sketch颜色和html颜色不一致,photoshop和sketch中图片色彩不一致的原因和解决办法...
  17. 据实而用 浅析会议摄像机的选购
  18. redis实战读后感(五)-构建支持程序
  19. 【day8】【洛谷算法题】-P3954成绩-刷题反思集[入门1顺序结构][附一周思考总结]
  20. Redis批量启停脚本

热门文章

  1. 人才稀缺的区块链,程序员转型入门必看这四项技能
  2. matlab怎么没有编辑器,实时编辑器介绍 - MATLAB Simulink - MathWorks 中国
  3. Java定时器每小时执行一次
  4. 第 22 章 备忘录模式
  5. css3滚动倾斜,jQuery 3D倾斜滚动页面效果
  6. matlab oj,Matlab习题(1)
  7. python选择路径窗口_python选择路径
  8. 极域电子教室软件怎么脱离控制_新疆灵感科技技术汇总~LED控制卡常见软、硬件问题...
  9. 鸿蒙系统下载地址_华为鸿蒙代码全开源,老规矩:先跑个Hello World....
  10. html贪吃蛇怎么加蛇尾,贪吃蛇制作移动+pc