On the Use of BERT for Automated Essay Scoring: Joint Learning of Multi-Scale Essay Representation学习
BERT在作文自动评分中的应用:多尺度作文表征的联合学习
1. Introduction
针对预训练语言模型在AES领域效果不好的问题进行分析:
首先,预先训练的模型通常是在句子层面上进行训练,但没有学习到足够的文章知识;
其次,AES训练数据通常非常有限,无法直接微调预先训练的模型,以便学习更好地表示论文。
2.Contribution
- 提出了一种新的作文评分方法,与BERT一起学习多尺度的作文表征,与传统的使用预先训练的语言模型相比,显著改善了结果。
- 该方法在长文本任务中表现出明显的优势,在ASAP任务中获得了几乎所有深度学习模型中最先进的结果。
- 受教师评分心理过程的启发,我们引入了两个新的损失函数,并使用RDrop从域外文章中进行迁移学习,进一步提高了作文评分的性能。
3.Multi-scale Essay Representation 多尺度作文表征
从三个尺度上得到了文章的多尺度表征:token-scale, segment-scale ,document-scale
- token-scale:对所有序列输出使用最大池化的操作获得token-scale文章表示。
- segment-scale:片段特征,通过LSTM获得。
- document-scale:文档尺度表示由BERT模型的[CLS]输出获得。由于[CLS]输出聚合了整个序列表示,它试图从最全局的粒度中提取文章信息。
4.Models
其中左半图利用一个BERT模型来提取文档和词汇级特征,并通过最大池化和一层Dense layer预测作文对应这两个尺度的分数;右半图利用一个BERT模型提取多尺度片段特征,也通过一层Dense layer预测各片段尺度的分数。通过将文档特性分数,词汇特征分数和片段特征分数相加得到最终的文章预测分数。
5.Data sets
实验数据使用的是ASAP数据集,以及CRP数据集,该数据集提供了来自几个时间段的2834个摘录和阅读轻松分数,范围从-3.68到1.72。摘录的平均长度为175个,字幕长度为252个。
ASAP数据集地址:
https://www.kaggle.com/c/asap-aes
6.Result
该方法在ASAP数据上 QWK 0.791。提出的多尺度特征表征方法在只使用回归损失函数,且无辅助任务优化的情况下效果超过了基于深度学习的方法如LSTM。
Wang Y , Wang C , Li R , et al. On the Use of BERT for Automated Essay Scoring: Joint Learning of Multi-Scale Essay Representation[J]. arXiv e-prints, 2022.
论文下载地址https://arxiv.org/abs/2205.03835
On the Use of BERT for Automated Essay Scoring: Joint Learning of Multi-Scale Essay Representation学习相关推荐
- 图模型+Bert香不香?完全基于注意力机制的图表征学习模型Graph-Bert
作者 | Jiawei Zhang.Haopeng Zhang.Congying Xia.Li Sun 译者 | 凯隐 编辑 | Jane 出品 | AI科技大本营(ID:rgznai100) [导读 ...
- END-TO-END NEURAL NETWORK BASED AUTOMATED SPEECH SCORING 翻译
端到端语音评分神经网络 Abstract Introduction Previous research Deep Learning Based Scoring Models CNN based sco ...
- Countering the Influence of Essay Length in Neural Essay Scoring学习
< 神经网络作文评分中作文长度的影响>学习总结 1. Introduction 前人认为AES系统不能依赖于论文长度,这是一个与写作熟练程度无关的因素. 2.Contribution 我们 ...
- 自动作文评分算法概述
自动作文评分是语言评测领域的一项重要子任务,可以帮助老师减少作文批改的负担.最近几年,有较多的学者致力于作文评分算法的研发,并取得了较大的进展. 自动作文评分系统一般由2个组件组成:作文表示组件和评分 ...
- 2020年NLP所有领域最新、经典、顶会、必读论文
本资源整理了近几年,自然语言处理领域各大AI相关的顶会中,一些经典.最新.必读的论文,涉及NLP领域相关的,Bert模型.Transformer模型.迁移学习.文本摘要.情感分析.问答.机器翻译.文本 ...
- NLP事件抽取顶刊顶会模型汇总-2021
SpERT(基于span)(使用BERT) Span-based Joint Entity and Relation Extraction with Transformer Pre-training ...
- Spelling Error Correction with Soft-Masked BERT
使用Soft-Masked BERT纠正拼写错误 Shaohua Zhang 1 , Haoran Huang 1 , Jicong Liu 2 and Hang Li 1 1 ByteDance A ...
- 谷歌丰田联合成果ALBERT了解一下:新轻量版BERT,参数小18倍,性能依旧SOTA
作者 | Less Wright 编译 | ronghuaiyang 来源 | AI公园(ID:AI_Paradise) [导读]这是来自Google和Toyota的新NLP模型,超越Bert,参数小 ...
- 如何使用 BERT 进行自然语言处理?
点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 来源:AI前线本文大约7510字,阅读时间约10分钟.本文介绍并探索 ...
最新文章
- 如何利用azMan (Authorization Manager) 实现 role-based的安全验证机制
- 为什么mac运行变慢,如何提升mac运行速度
- php答题评分,Thinkphp 答题 评语
- 将可见的电子签名添加到PDF
- 为什么不应该使用(长期存在的)功能分支
- Android中LayoutInflater()方法
- 演示使用Metasploit入侵Windows
- 视频或动画丢帧_概念介绍和解决策略
- NR 5G SSB介绍
- java写入文件中文乱码问题_解决 JAVA 写入文本文件时中文乱码
- 【三环集团logo】用Python 小海龟实现~
- Android组件化开发实践和案例分享 1
- 小米的200万不是这么好挣的!
- stm32 SWD调试接口的使用
- 【PTA】帅到没朋友(C语言)
- 各品牌手机音视频格式支持一览表
- bcedit双系统更改启动项名称_Win7下双系统修改BCD启动项名称
- CEF3如何不加载图片以方便采集信息
- 字符串处理、变量初始值处理、扩展的脚本技巧、正则表达式
- 壁纸小程序源码(基于thinkphp后端,uniapp小程序)
热门文章
- 遇到mysqladmin flush-hosts报错解决思路
- 数据仓库和数据集市的概念、区别与联系
- SAP JCo 功能
- asp.net面试常见试题
- 【WLAN】【测试】Linux下aircrack-ng的应用之空口抓包全解
- 单源最短路径算法java_数据结构 - 单源最短路径之迪杰斯特拉(Dijkstra)算法详解(Java)...
- TP5查询构造器查询语句select、find、colum、value详解
- 近端梯度下降法 (proximal gradient descent)
- java字符串长度(java字符串长度压缩)
- 时间序列分析的基本思路与步骤(入门级,新手必看!!!)