收集了一下近几年用修辞结构理论(RST)做篇章结构解析的论文。关于修辞结构理论的介绍,可参考博客

做英文篇章RST解析,一般都是用RST Discourse Treebank数据集,共385篇文章,其中347篇训练集,38篇测试集。共包含53个单核修辞关系和25个多核修辞关系,下面的实验仅仅考虑了18种修辞关系(relation),具体分布如下:

修辞结构理论标注数据集 以及详细标注手册,每种修辞关系的意义也可从标注手册中找到。

评价指标有四个, 来自书籍The Theory and Practice of Discourse Parsing and Summarization:

Span:评价预测RST树骨架的能力
Nuclearity:评价预测RST树骨架和Nuclearity的能力
Relation:评价预测RST树骨架和Relation的能力
Full:评价预测RST树骨架和Nuclearity,以及Relation的能力

注意这里提到的实验,使用的是数据集给定的EDU基本语篇单元,而不是自己分割的

(1)A Linear-Time Bottom-Up Discourse Parser with Constraints and Post-Editing

来源: acl2014
网址:https://aclanthology.org/P14-1048.pdf
代码:https://github.com/arne-cl/feng-hirst-rst-parser

使用两个线性连CRF,贪婪自底向上的方式构建RST树。时间复杂度更小,线性于篇章中的句子个数。为了提高pipeline的准确度,增加了维特比解码的限制条件。引入post-edit(后处理),对RST树进行修正。

测试集统计:

考虑了18种语篇关系,在RST Discourse Treebank数据集上的实验结果:

38篇测试集跑完需要的时间:

(2) Representation Learning for Text-level Discourse Parsing

来源:acl2014
网址:https://aclanthology.org/P14-1002.pdf
代码:https://github.com/jiyfeng/RSTParser
代码:https://github.com/jiyfeng/DPLP

使用的特征:

考虑了18种语篇关系,在RST Discourse Treebank数据集上的实验结果:


值得一提的是代码https://github.com/jiyfeng/DPLP公开训练的模型以及测试代码,可以直接进行篇章的解析,需要用到斯坦福的corenlp包,但是代码是python2。本人做了一些修改,适配python3版本,代码详见https://github.com/wangwang110/DPLP

(3)Transition-based Neural RST Parsing with Implicit Syntax Features

来源:coling2018
网址:https://aclanthology.org/C18-1047.pdf
代码:https://github.com/fajri91/NeuralRST

将篇章结构预测转化为一系列action的预测(Transition-based model)。利用隐式语法信息辅助RST解析,隐式语法信息来自Bi-Affine dependency parser的神经网络隐层输出。

RST解析的一个例子:

将结构预测转化为Action序列预测:

考虑了18种语篇关系,在RST Discourse Treebank数据集上的实验结果(宏平均):

Feng and Hirst, 2014Ji and Eisenstein, 2014分别对应于本博客提到的(1)和(2)两篇论文

(4)Top-Down RST Parsing Utilizing Granularity Levels in Documents

来源:AAAI2020
网址:https://arxiv.org/pdf/2005.02680.pdf
代码:https://github.com/nttcslab-nlp/Top-Down-RST-Parser

利用段落,句子,EDU三个粒度的信息,自顶向下逐步将篇章结转树结构。图c是论文提出的构建篇章结构树的方法。先得到篇章到段落的结构,再将段落替换为段落到句子的结构,最后再将句子替换为句子到EDU的结构。不同粒度的结构是分开训练的。

表征模型:

parser过程:

考虑了18种语篇关系,在RST Discourse Treebank数据集上的实验结果:


YZF18是前面介绍的论文(3),FH14gCRF是前面介绍的论文(1),JE14 DPLP是前面介绍的论文(2)

(5)A Top-Down Neural Architecture towards Text-Level Parsing of Discourse Rhetorical Structure

来源:ACL2020
网址:https://arxiv.org/pdf/2005.02680.pdf
代码:https://github.com/NLP-Discourse-SoochowU/t2d_discourseparser

提出一个基于encoder 和decoder 的自顶向下的神经篇章解析模型,认为自顶向下的方式可以利用全局信息,也和人们阅读的方式一致。

EN表示在RST Discourse Treebank数据集上的实验结果(宏平均),考虑了18种语篇关系:


第二行Ji&Eisenstein(2014)和第三行Feng&Hirst(2014)分别对应本博客提到的论文(2)和(1)。

结果相差比较大的原因是:该论文使用的是A dependency perspective on RST discourse parsing and evaluation提出的评价方式,与先前的使用的评价方式有些不同。总之,在英文数据集上,该论文的效果不及前面的篇论文。

更全面的统计:
https://paperswithcode.com/sota/discourse-parsing-on-rst-dt


如有疑问,欢迎提问;如有错误,欢迎批评指正。

修辞结构理论论文集合相关推荐

  1. Algorithm:数学建模大赛(CUMCM/NPMCM)之全国大学生数学建模竞赛历年考察知识点统计可视化分析、论文评阅标准参考、国内外CUMCM数学建模类参考文献论文集合之详细攻略

    Algorithm:数学建模大赛(CUMCM/NPMCM)之全国大学生数学建模竞赛历年考察知识点统计可视化分析.论文评阅标准参考.国内外CUMCM数学建模类参考文献论文集合之详细攻略 目录 全国大学生 ...

  2. UA MATH523A 实分析3 积分理论例题 集合的特征函数L2收敛的条件

    UA MATH523A 实分析3 积分理论例题 集合的特征函数L2收敛的条件 例 假设{En}\{E_n\}{En​}是一个有限测度空间(X,M,μ)(X,\mathcal{M},\mu)(X,M,μ ...

  3. DL之GANDCGNNcGAN:GANDCGNNcGAN算法思路、关键步骤的相关配图和论文集合

    DL之GAN&DCGNN:GAN&DCGNN&cGAN算法思路.关键步骤的相关配图和论文集合 目录 GAN&DCGNN&cGAN相关论文推荐 1.GAN论文 2 ...

  4. CV之CycleGAN:CycleGAN算法相关思路配图、论文集合

    CV之CycleGAN:CycleGAN算法相关思路配图.论文集合 目录 CycleGAN算法相关思路配图 CycleGAN算法相关论文集合 改进的StarGAN CycleGAN算法相关思路配图 1 ...

  5. 大专计算机系毕业课题6000字,计算机理论论文6000字:高校科研.doc

    计算机理论论文6000字:高校科研 计算机理论论文6000字:高校科研 论文最好能建立在平日比较注意探索的问题的基础上,写论文主要是反映学生对问题的思考, 详细内容请看下文计算机理论论文6000字. ...

  6. 计算机理论专业研究生论文课题,计算机理论方向论文选题 计算机理论论文标题如何定...

    精选了[100道]关于计算机理论方向论文选题供您后续的写作参考,在写计算机理论论文之前,很多大学生总是被计算机理论论文标题如何定难倒怎么办?请阅读本文! 一.比较好写的计算机理论论文题目: 1.如何提 ...

  7. CVPR2013一些论文集合供下载(visual tracking相关)

    CVPR2013一些论文集合供下载(visual tracking相关) zouxy09@qq.com http://blog.csdn.net/zouxy09 看到CVPR2013很多作者都开放了他 ...

  8. 计算机句法分析的研究现状,计算机理论论文融合语义和句型信息的中文句法分析方法研究与实现...

    <计算机理论论文融合语义和句型信息的中文句法分析方法研究与实现>由会员分享,可在线阅读,更多相关<计算机理论论文融合语义和句型信息的中文句法分析方法研究与实现(2页珍藏版)>请 ...

  9. 计算机理论指导论文,关于计算机理论论文集锦-20210705011555.docx-原创力文档

    关于计算机理论论文集锦 多元智能理论与计算机实践教学 一.多元智能理论与教学的关系 多元智能理论是由美国哈佛大学教育研究院的心理发展学家霍华德加德纳在1983年提出.其中,主要包括语言智能.逻辑一数理 ...

最新文章

  1. Python全栈Day 15部分知识点
  2. element not visible的解决方法
  3. svn中项目管理中ec_笔记本电脑中的隐形管家:EC
  4. PHP函数stream_context_create()模拟POST/GET
  5. Sliverlight之 画刷
  6. 高清HDMI接口保护用TVS二极管阵列选型
  7. 蚂蚁架构师郭援非:分布式数据库是金融机构数字化转型的最佳路径
  8. windows下向GitHub上传代码
  9. git放弃本地修改:
  10. python代写学生作业_data留学生作业代做、代写Python程序设计作业、代做Python实验作业...
  11. HDU3689 Infinite monkey theorem 无限猴子(字符串DP+KMP)
  12. U8 8.9 数据库置疑恢复方法
  13. 信息安全保障人员(CISAW)工控网络安全方向认证介绍
  14. 优化易语言程序占用内存
  15. MySQL 8.0 高可用之如何解决从库数据被修改引起的主从同步错误
  16. 关于RapidSSL证书
  17. 基于Python个人博客系统设计与实现 开题报告
  18. JAVA租房网站计算机毕业设计Mybatis+系统+数据库+调试部署
  19. 申请软件著作权登记没有源代码怎么办?如果有源代码怎么快速下证?
  20. 电脑组装与维修完全学习手册 pdf电子书

热门文章

  1. Java数组、类集框架
  2. 集合竞价如何买入_世界上最稳健的抓涨停方法“10分钟集合竞价”选股诀窍,买入直接稳赚10个点,赚到笑...
  3. html轮播图水平传送带,经典的白富美型jQuery图片轮播插件
  4. Mysql复习(基础概念+基础操作)
  5. 定时任务_定时任务Quartz入门
  6. python怎么直接操作git_基于python实现操作git过程代码解析
  7. vscode运行vue时,显示loader. js SyntaxError: Unexpected identifier
  8. android html 换行_android TextView怎么设置个别字体颜色并换行?
  9. 思路不清晰还想月薪过万?学会这4招,升职加薪有望
  10. 下面属于python内置对象的有哪些_Python内置对象实现的方法及注意事项