Question Difficulty Prediction for READING Problems in Standard Tests

一、基本信息

时间:2017年

会议:AAAI(CCF推荐的A类会议 人工智能与模式识别)

作者:黄振亚等(陈恩红团队)

机构:中国科学技术大学

二、论文五要素

1、论文动机

1.1 背景:

在标准测试(如TOFEL、SAT)中,需要不同难度的试题保证考试的公平。而传统的试题难度评估方法是人工标注和考前组织测试,存在各自的缺点。此外,大量的辅助信息(如学生答题记录、习题文本信息)可用于习题难度预测。

(即作者认为习题的难度和习题的文本信息有关系,因此使用习题的文本对习题难度进行预测。大致的逻辑:测试中需要不同的习题难度——>传统的习题难度评估方法存在缺点——>利用现有的答题记录和习题文本可以实现习题难度自动预测)

1.2 目的:

在组织考试前就需要知道试卷中试题的难度,因此需要预测标准测试中英语阅读题的难度(即习题难度预测)

1.3 挑战:

如何建立一个统一的方式来理解和表达文本材料的多个部分(可理解为:为什么用word2vec,为什么使用CNN)

如何区分文本材料对具体问题的重要性(可理解为:为什么选用attention)

如何消除不同测试中的难度偏差(可理解为:为什么要使用test-dependent损失函数)

英语阅读题:包括TD、TQ和TO。TD为阅读文本(document),TQ为题干(question),TO为选项(option)(如下图)

2、传统方法

2.1 评估习题难度的传统方法:

(1)专家对习题难度进行标注

缺点:工作量大、主观性强

(2)组织人员对试题样本进行试测,然后对试题样本进行稍加修改投入使用

缺点:耗时且耗费大量人力物力

共同点:二者皆存在试题泄露风险

2.2 前人研究-习题难度:

(1)影响习题难度可能因素:

①question attributes and examinees'  abilities (Beck et al.1997)

②question attributes(如question types习题类型,question structures习题结构,knoledge depth深度)

(2)试图利用考生从测试中得到的反馈(即成绩)来进行习题难度的评估,并形成了一些心理学理论(如经典测试理论CTT,认知诊断CDA)

2.3 前人研究-NLP领域的文本理解:

注意:作者提出的模型中的最关键的步骤就是对习题文本的理解和表征

(1)language modeling(Smith et al.2015)(即更注重从习题的语法和语义方面出发进行建模,如句子的结构,词汇语法)

(2)neural network(Hermann et al.2015) (即使用神经网络将习题转化为语义表征)

3、主要方法

针对英语阅读理解题的难度预测提出了一个新的模型TACNN(Test-aware Attention-based Convolutional Neural Network framework )

训练阶段:

是一种有监督的方法,ground truth是学生答题的通过率,损失函数用在训练阶段用来调整模型的参数,该文提出了一个test-dependent pairwise loss function损失函数

TACNN的输入:习题的文本信息、习题的难度、测试编号、习题编号(如下图)

测试阶段:

TACNN的输入:习题的文本信息

TACNN的输出:预测得到的习题难度值

模型框架图:(分为四个部分,如下图所示)

①Input Layer:输入层

②Sentence CNN Layer:句子CNN层(模型重点)

作用:从句子语义角度去学习每个习题的所有文本信息。(即将习题中的句子进行表征)

③Attention Layer:注意力层(模型重点)

作用:通过attention机制衡量每个习题中不同文本信息对习题难度的影响

④Prediction Layer:预测层/输出层

4、实验

数据集:

来自科大讯飞收集的数据,具体如下图所示,可以看到数据量很大

对比方法:

CNN:使用attention-ignored机制,损失函数用的test-independent损失函数

ACNN:具有TACNN中的attention机制,损失函数用的test-independent损失函数(用于对比TACNN模型中的tetst-dependent损失函数)

TCNN:使用attention-ignored机制,损失函数用的是test-dependent损失函数(用于对比TACNN模型中的attention机制)

HABCNN:以上三种都是与自己提出的进行对比,这个则是和他人的模型比较(他人的模型作者进行了稍加修改为了适用于习题难度预测问题上)。

实验评价指标:

RMSE(Salakhutdinov and Mnih 2011):均方根误差,越小越好,评价习题难度预测值和真实值的准确度对比(注意:预测值是模型在训练阶段训练好后,将测试集的习题放入训练好的模型后得到的习题难度值;这里的真实值是指测试集中的习题难度值)

DOA(Liu et al.2012):一致性(啥玩意?没懂是干嘛的,需要追溯该论文引用的那篇论文),越大越好,从ranking的角度评价?

PCC(Benesty et al.2009):皮尔逊相关系数 ,越大越好,评价习题难度真实值和预测值的相关性

PR:t-test通过率(啥玩意?不懂是啥,需要追溯该论文引用的那篇论文),越大越好,评价confidence performance

实验结果:

5、创新点

三、论文总结

这篇文章提出的模型的前提:习题文本信息丰富、大量的数据(包括习题和学生的答题记录)

此外,这篇文章中得到的习题难度是absolute difficulty values,即绝对难度(区别于相对难度,即某个学生对于某道题的难度)

挑战:

如何建立一个统一的方式来理解和表达文本材料的多个部分——>使用word2vec对习题文本信息的单词进行表征,使用sentence CNN表达习题文本信息中的句子(包括阅读的文章、题干、选项)

如何区分文本材料信息中哪部分对具体习题难度的重要性——>使用attention机制对习题文本信息的重要部分进行关注

如何消除不同测试中的难度偏差——>提出了test-independent的损失函数

(后面继续补充)

最后,发现某个网站上的关于这篇论文的PPT写得挺好的,需要的也可以看看,链接https://myslide.cn/slides/17905

习题难度预测(英语阅读题)-Question Difficulty Prediction for READING Problems in Standard Tests相关推荐

  1. 个性化习题推荐-Exercise recommendation based on knowledge concept prediction

    一.基本信息 时间:2020年 期刊:Knowledge-Based Systems(SCI1区) 作者:吴正洋等(作者主页链接:http://faculty.scholat.com/homepage ...

  2. 计算机技能高考超纲题,习题难度的划分

    <习题难度的划分>由会员分享,可在线阅读,更多相关<习题难度的划分(4页珍藏版)>请在人人文库网上搜索. 1.题库类产品如何计算题目的难度值一.引言题库类产品(如猿题库.易题库 ...

  3. 【渝粤题库】国家开放大学2021春1354高级英语阅读(2)题目

    试卷代号:1354 2 0 2 1年春季学期期末统一考试 高级英语阅读(2) 试题 2021年7月 注意事项 一.将你的学号.姓名及分校(工作站)名称填写在答题纸的规定栏内.考试结束后,把试卷和答题纸 ...

  4. 高中英语话题阅读 计算机,计算机 英语学科题.doc

    计算机英语学科题计算机英语学科题 窗体顶端 ? 刘老师在讲解"旅游"这一话题时,利用幻灯片向学生展示自己的电子相册,这里幻灯片主要所表现的是媒体的何种特征:A.呈现力B. 传播力C ...

  5. 计算机英语阅读路线,高考英语阅读理解真题解析·计算机运用

    说明:引用此文请注明出处,并务请保留后面的有效链接地址,谢谢! 高考英语阅读理解真题解析·计算机运用 Computer people talk a lot about the need for oth ...

  6. 考研英语阅读关于计算机课堂教学,2016考研英语阅读真题逐句拆分解析(165)...

    提升阅读和翻译能力要打好基础,要做到这一点,一定要学会精读,以历年真题为依 托,仔细研究每个句子,日积月累,坚持百日,相信会有很大的提升.下面新东方在线带大家来逐句拆分解读历年阅读真题,从成分到词汇及 ...

  7. 有关计算机时代的英语阅读理解题,2020-2021高考英语阅读理解综合经典题附详细答案...

    一.高中英语阅读理解 1.阅读理解 City trees grow faster and die younger than trees in rural forestry, a new study f ...

  8. 【xjtu英语自主学习平台】为什么研究中国建筑阅读题答案

    为什么研究中国建筑阅读题答案 (仅供参考,请自行阅读书籍) the structural system the plan arrangement six construction details tw ...

  9. 新东方mti百科知识pdf_新东方 2019考研英语 阅读理解精读100篇 基础版.pdf

    作 者 :印建坤著 出版发行 : 北京:群言出版社 , 2018.02 ISBN号 :978-7-5193-0366-2 页 数 : 338 丛书名 : 新东方考研英语培训教材 原书定价 : 48.0 ...

最新文章

  1. 154 Find Minimum in Rotated Sorted Array 2
  2. 如何使用数据库SCHEDULER来执行清归档脚本
  3. 2cocos2dx别踩白块游戏案例
  4. 腾讯课堂的物理实验(2017计蒜客初赛第三场)
  5. unbuntu运行shell脚本的问题
  6. jackson json 转换Bean, Bean 里没有对应的值 jackson Unrecognized field
  7. 发言稿开场白范文_发言稿开场白
  8. iOS开发中@property的属性weak nonatomic strong readonly等介绍
  9. Felix的Nodejs代码风格
  10. keepalived + web高可用集群实现主从模型、双主模型配置
  11. NumPy库---数组进阶操作
  12. 【HTML】【简易电子相册】overflow:hidden;
  13. 水面船舶雷达监视-信天翁雷达监视系统
  14. 【C语言练习——打印上三角及其变形】
  15. IPv4(分类编址)
  16. 线性代数应用于计算机科学例子,Sagemath在线性代数教学中的应用
  17. python局域网文件互传
  18. 洛谷 U80455 逃跑的Seaway
  19. 计算机常用的输出设备有什么作用,常用的多媒体输入输出设备有哪些,主要功能是什么...
  20. 微信小程序下载图片预览和真机调试均无问题,发布到远程后点击下载没有任何反应

热门文章

  1. 潘凯:C++对象布局及多态实现的探索(三)
  2. 潘凯:C++对象布局及多态实现的探索(十二)
  3. java实现当前时间往前推N小时
  4. MATLAB给目标音频文件设计滤波器去除所添加的噪声
  5. 中南卡通动漫研学教育基地
  6. 丹麦网站推出提供俊男靓女精子或卵子服务
  7. SAP中销售交货问题处理实例
  8. Java教务管理系统学生端_Java 简易教务管理系统
  9. 公共数据运营的框架设计
  10. chrome浏览器缓慢_缓慢的浏览器? 这是加快Chrome浏览器速度的方法