【论文阅读】2021中国法研杯司法考试数据集研究(CAIL2021)
英文标题:JEC-QA: A Legal-Domain Question Answering Dataset
中文标题:法律领域问答数据集
论文下载:arxiv@1911.12011
项目地址:GitHub@CAIL2021
比赛链接:CAIL2021@司法考试
序言
本论文是关于中国法律智能技术评测202120212021比赛中司法考试任务数据集的构成与一些测试模型的评估。在上面的项目地址GitHub@CAIL2021中已有测试模型,但是它完全没有应用到数据集中给到的参考书目文档,笔者在阅读本论文前认为参考书目文档可能可以用于数据增强,或用于构建知识图谱以预训练得到更好的题干及选项的语义表示。诸多尝试后,笔者决定还是先参考原作者已完成的工作,事实上原作者是将司法考试任务视为阅读理解任务来评估的,其中使用到ElasticSearch\text{ElasticSearch}ElasticSearch检索以及多级推理等技术,这意味着该任务的解决思路将会十分开阔,但是该任务本身的困难程度是非常高的,因为目前机器做题的成绩远远差于普通人类的水平。
笔者建议对该任务感兴趣的朋友可以先阅读本文以熟悉前人的解决思路,然后再加以改进并测试。项目地址GitHub@CAIL2021中的基线模型的正确率大约为26%26\%26%,这已经足以通过该评测任务第一阶段的测试了。
其实这个任务目前也没有多少队伍在做,笔者只是对这个话题非常感兴趣,所以花了一些功夫。个人觉得对参考书目文档的预处理是非常重要的,其中有许多冗余的信息,然后数据集中的subject
字段是存在缺失的,而这个字段其实对信息检索是非常有帮助的,所以需要额外训练模型对该字段进行预测,这个笔者之前也想到了,在本论文中原作者也强调了这一点的必要性。
文章目录
- 序言
- 摘要 Abstract\text{Abstract}Abstract
- 111 引入 Introduction\text{Introduction}Introduction
- 222 相关工作 Related Work\text{Related Work}Related Work
- 2.12.12.1 阅读理解 Reading Comprehension\text{Reading Comprehension}Reading Comprehension
- 2.2\text{2.2}2.2 开放领域问答 Open-domain Question Answering\text{Open-domain Question Answering}Open-domain Question Answering
- 2.32.32.3 法律智能 Legal Intelligence\text{Legal Intelligence}Legal Intelligence
- 333 数据集构成与分析 Dataset Construction and Analysis\text{Dataset Construction and Analysis}Dataset Construction and Analysis
- 3.13.13.1 数据集构成 Dataset Construction\text{Dataset Construction}Dataset Construction
- 3.23.23.2 推理类型 Reasoning Types\text{Reasoning Types}Reasoning Types
- 444 实验 Experiments\text{Experiments}Experiments
- 4.14.14.1 检索策略 Retrieve Strategy\text{Retrieve Strategy}Retrieve Strategy
- 4.24.24.2 实验配置 Experiment Settings\text{Experiment Settings}Experiment Settings
- 4.34.34.3 基线 Baselines\text{Baselines}Baselines
- 4.44.44.4 实验结果 Experimental Results\text{Experimental Results}Experimental Results
- 4.54.54.5 比较分析 Comparative Analysis\text{Comparative Analysis}Comparative Analysis
- 4.64.64.6 案例分析 Case Study\text{Case Study}Case Study
- 555 结论 Conclusion\text{Conclusion}Conclusion
- 666 致谢 Acknowledgements\text{Acknowledgements}Acknowledgements
- 附录A\text{A}A:参考文献
- 后记
摘要 Abstract\text{Abstract}Abstract
本文提出目前规模最大的法律领域问答数据集JEC-QA\text{JEC-QA}JEC-QA,数据源为中国国家司法考试(National Judicial Examination of China,下简称为NJEC\text{NJEC}NJEC)真题,每年NJEC\text{NJEC}NJEC的通过率约为10%10\%10%。
司法考试中通常需要检索相关法条以完成答题,这属于逻辑推理的过程,因此常规的问答模型在JEC-QA\text{JEC-QA}JEC-QA数据集上的表现并不是很好,最先进的问答模型也只能取得28%28\%28%的正确率,而专业人员平均能够达到81%81\%81%的正确率,即便是非专业人员稍加训练一般也能达到64%64\%64%的正确率,因此人类与机器在司法考试任务上的表现差异巨大。
JEC-QA\text{JEC-QA}JEC-QA数据集可以从官网获得:该数据集需要发送邮件向原作者申请获得,如果急需使用的可以通过笔者分享的链接下载
【论文阅读】2021中国法研杯司法考试数据集研究(CAIL2021)相关推荐
- 第三届“中国法研杯”司法人工智能挑赛(CAIL2020)即将启动
中国法研杯 聚焦人工智能技术在司法领域的应用,中国电科X+AI系列挑战赛之"中国法研杯"司法人工智能挑战赛(CAIL2020)将于2020年5月15日放注册报名.本次技术竞赛面向全 ...
- 活动报名 | 第三届中国法研杯司法人工智能挑战赛颁奖会日程出炉
官网:http://cail.cipsc.org.cn/ 法律智能研究旨在赋予机器理解法律文本的能力.近些年来,随着以裁判文书为代表的司法大数据不断公开,以及自然语言处理技术的不断突破,如何将人工智能 ...
- [论文阅读] (30)李沐老师视频学习——3.研究的艺术·讲好故事和论点
<娜璋带你读论文>系列主要是督促自己阅读优秀论文及听取学术讲座,并分享给大家,希望您喜欢.由于作者的英文水平和学术能力不高,需要不断提升,所以还请大家批评指正,非常欢迎大家给我留言评论,学 ...
- WSDM 2022 推荐系统论文阅读(中)
继续上一篇文章来阅读WSDM 2022中推荐系统的论文: WSDM 2022 推荐系统论文阅读(上) 声明:本论文阅读笔记主要是对论文摘要的概括,评论仅代表个人的阅读观点,欢迎大家在评论区讨论! 1. ...
- 通信工程论文 通信网络中故障数据优化检测仿真研究
通信网络中故障数据优化检测仿真研究 专业:通信工程 2022年5月 论文题目:通信网络中故障数据优化检测仿真研究 学科专业:通信工程 摘 要 在对通信网络之中的故障数据进行检测时,考虑到在通信网络之中 ...
- [论文阅读笔记52]深度学习实体关系抽取研究综述
来源:软件学报 2019 1.摘要: 围绕有监督和远程监督两个领域,系统总结了近几年来中外学者基于深度学习的实体关系 抽取研究进展,并对未来可能的研究方向进行了探讨和展望. 2.经典的实体关系抽取方法 ...
- 论文阅读:高炉炼铁工序入炉焦比预测的研究
论文题目:高炉炼铁工序入炉焦比预测的研究 作者:岳有军.董安.赵辉.王红君 论文要点 1 研究背景及方法比较 2 研究方法论述 灰色关联度分析(GRA) 最小二乘支持向量机(LSSVM) 粒子群算法( ...
- 论文阅读(2021) 探讨语境在会话中话语层情绪、行为和意图分类中的作用
一. 介绍 采用特定于说话者和语境的建模来解决这些任务,在这些任务中,语境的作用还没有得到彻底的探讨,部分原因是在各种话语层面的对话理解任务中缺乏统一的框架 提出了几种独特的情境探测策略:(1) 特定 ...
- 论文阅读 2021 —— DRO: Deep Recurrent Optimizer for Structure-from-Motion
阅读一个关于预测深度图和相机姿态的一篇论文<DRO: Deep Recurrent Optimizer for Structure-from-Motion>用于SFM的深度循环优化器. 通 ...
最新文章
- 四、“一场跨越时空持续数世纪的对话”
- mysql一些写常用命令
- 如何使用div优雅的布局
- MSSQL - 最佳实践 - 如何打码隐私数据列
- brackets作为html编辑器,为前端而生丨编辑器 Brackets 及配置推荐
- 线性二次型最优控制器LQR设计原理以及matlab实现
- 探索Windows Azure 监控和自动伸缩系列1 - 连接中国区Azure
- php中curl、fsockopen的应用
- 保姆级教程--常见的内网穿透有哪几种
- 利用Python一键爬取上海二手房信息
- 移动硬盘插入提示需要格式化RAW_Macbook无法识别移动硬盘?!不仅仅因为硬盘格式问题...
- vscode配置python环境以及使用json文件配置默认解释器、代码自动保存、pydesigner、kite
- THREE将左键改为平移右键改为旋转
- API获取订单接口文档使用说明
- Windows10 无法正常搜狗和搜狗输入法
- 关于区块链在存证方面的应用
- 选电脑时你需要了解的一些小知识
- 《Total Commander:万能文件管理器》——第5.4节.更多压缩格式及插件
- GridView 72般绝技 转自清清月儿收藏
- Java背景颜色怎么设成随机的_java - 如何将按钮的背景设置为具有设置约束的随机颜色? - SO中文参考 - www.soinside.com...
热门文章
- thinkPHP基于php的衡水游泳馆管理系统--php-计算机毕业设计
- check the manual that corresponds to your MySQL server
- [教你警告消除]Warning[Pe1072]: a declaration cannot have a label!
- Oauth2 数据库表说明
- 基于Ernie-3.0 CAIL2019法研杯要素识别多标签分类任务
- (DP)codeforces - 710E Generate a String
- 一个普通码农的Linux之路
- python与tensorflow实现人脸表情识别(基于CNN)
- java毕业设计题目
- CarSim仿真快速入门(十五)—CarSim传感器仿真之ADAS Sensor Objects (1)
- 第三届“中国法研杯”司法人工智能挑赛(CAIL2020)即将启动