BERT在作文自动评分中的应用:多尺度作文表征的联合学习

1. Introduction

针对预训练语言模型在AES领域效果不好的问题进行分析:
首先,预先训练的模型通常是在句子层面上进行训练,但没有学习到足够的文章知识;
其次,AES训练数据通常非常有限,无法直接微调预先训练的模型,以便学习更好地表示论文。

2.Contribution

  • 提出了一种新的作文评分方法,与BERT一起学习多尺度的作文表征,与传统的使用预先训练的语言模型相比,显著改善了结果。
  • 该方法在长文本任务中表现出明显的优势,在ASAP任务中获得了几乎所有深度学习模型中最先进的结果。
  • 受教师评分心理过程的启发,我们引入了两个新的损失函数,并使用RDrop从域外文章中进行迁移学习,进一步提高了作文评分的性能。

3.Multi-scale Essay Representation 多尺度作文表征

三个尺度上得到了文章的多尺度表征:token-scale, segment-scale ,document-scale

  • token-scale:对所有序列输出使用最大池化的操作获得token-scale文章表示。
  • segment-scale:片段特征,通过LSTM获得。
  • document-scale:文档尺度表示由BERT模型的[CLS]输出获得。由于[CLS]输出聚合了整个序列表示,它试图从最全局的粒度中提取文章信息。

4.Models


其中左半图利用一个BERT模型来提取文档和词汇级特征,并通过最大池化和一层Dense layer预测作文对应这两个尺度的分数;右半图利用一个BERT模型提取多尺度片段特征,也通过一层Dense layer预测各片段尺度的分数。通过将文档特性分数,词汇特征分数和片段特征分数相加得到最终的文章预测分数。

5.Data sets

实验数据使用的是ASAP数据集,以及CRP数据集,该数据集提供了来自几个时间段的2834个摘录和阅读轻松分数,范围从-3.68到1.72。摘录的平均长度为175个,字幕长度为252个。
ASAP数据集地址:
https://www.kaggle.com/c/asap-aes

6.Result


该方法在ASAP数据上 QWK 0.791。提出的多尺度特征表征方法在只使用回归损失函数,且无辅助任务优化的情况下效果超过了基于深度学习的方法如LSTM。

Wang Y , Wang C , Li R , et al. On the Use of BERT for Automated Essay Scoring: Joint Learning of Multi-Scale Essay Representation[J]. arXiv e-prints, 2022.
论文下载地址https://arxiv.org/abs/2205.03835

On the Use of BERT for Automated Essay Scoring: Joint Learning of Multi-Scale Essay Representation学习相关推荐

  1. 图模型+Bert香不香?完全基于注意力机制的图表征学习模型Graph-Bert

    作者 | Jiawei Zhang.Haopeng Zhang.Congying Xia.Li Sun 译者 | 凯隐 编辑 | Jane 出品 | AI科技大本营(ID:rgznai100) [导读 ...

  2. END-TO-END NEURAL NETWORK BASED AUTOMATED SPEECH SCORING 翻译

    端到端语音评分神经网络 Abstract Introduction Previous research Deep Learning Based Scoring Models CNN based sco ...

  3. Countering the Influence of Essay Length in Neural Essay Scoring学习

    < 神经网络作文评分中作文长度的影响>学习总结 1. Introduction 前人认为AES系统不能依赖于论文长度,这是一个与写作熟练程度无关的因素. 2.Contribution 我们 ...

  4. 自动作文评分算法概述

    自动作文评分是语言评测领域的一项重要子任务,可以帮助老师减少作文批改的负担.最近几年,有较多的学者致力于作文评分算法的研发,并取得了较大的进展. 自动作文评分系统一般由2个组件组成:作文表示组件和评分 ...

  5. 2020年NLP所有领域最新、经典、顶会、必读论文

    本资源整理了近几年,自然语言处理领域各大AI相关的顶会中,一些经典.最新.必读的论文,涉及NLP领域相关的,Bert模型.Transformer模型.迁移学习.文本摘要.情感分析.问答.机器翻译.文本 ...

  6. NLP事件抽取顶刊顶会模型汇总-2021

    SpERT(基于span)(使用BERT) Span-based Joint Entity and Relation Extraction with Transformer Pre-training ...

  7. Spelling Error Correction with Soft-Masked BERT

    使用Soft-Masked BERT纠正拼写错误 Shaohua Zhang 1 , Haoran Huang 1 , Jicong Liu 2 and Hang Li 1 1 ByteDance A ...

  8. 谷歌丰田联合成果ALBERT了解一下:新轻量版BERT,参数小18倍,性能依旧SOTA

    作者 | Less Wright 编译 | ronghuaiyang 来源 | AI公园(ID:AI_Paradise) [导读]这是来自Google和Toyota的新NLP模型,超越Bert,参数小 ...

  9. 如何使用 BERT 进行自然语言处理?

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 来源:AI前线本文大约7510字,阅读时间约10分钟.本文介绍并探索 ...

最新文章

  1. 如何利用azMan (Authorization Manager) 实现 role-based的安全验证机制
  2. 为什么mac运行变慢,如何提升mac运行速度
  3. php答题评分,Thinkphp 答题 评语
  4. 将可见的电子签名添加到PDF
  5. 为什么不应该使用(长期存在的)功能分支
  6. Android中LayoutInflater()方法
  7. 演示使用Metasploit入侵Windows
  8. 视频或动画丢帧_概念介绍和解决策略
  9. NR 5G SSB介绍
  10. java写入文件中文乱码问题_解决 JAVA 写入文本文件时中文乱码
  11. 【三环集团logo】用Python 小海龟实现~
  12. Android组件化开发实践和案例分享 1
  13. 小米的200万不是这么好挣的!
  14. stm32 SWD调试接口的使用
  15. 【PTA】帅到没朋友(C语言)
  16. 各品牌手机音视频格式支持一览表
  17. bcedit双系统更改启动项名称_Win7下双系统修改BCD启动项名称
  18. CEF3如何不加载图片以方便采集信息
  19. 字符串处理、变量初始值处理、扩展的脚本技巧、正则表达式
  20. 壁纸小程序源码(基于thinkphp后端,uniapp小程序)

热门文章

  1. 遇到mysqladmin flush-hosts报错解决思路
  2. 数据仓库和数据集市的概念、区别与联系
  3. SAP JCo 功能
  4. asp.net面试常见试题
  5. 【WLAN】【测试】Linux下aircrack-ng的应用之空口抓包全解
  6. 单源最短路径算法java_数据结构 - 单源最短路径之迪杰斯特拉(Dijkstra)算法详解(Java)...
  7. TP5查询构造器查询语句select、find、colum、value详解
  8. 近端梯度下降法 (proximal gradient descent)
  9. java字符串长度(java字符串长度压缩)
  10. 时间序列分析的基本思路与步骤(入门级,新手必看!!!)