论文笔记整理:余海阳,浙江大学硕士,研究方向为知识图谱、自然语言处理。


链接:https://arxiv.org/abs/1911.01616

动机

基于目标的情感分析或基于方面的情感分析(ABSA)是指在细粒度的层次上解决各种情感分析任务,包括但不限于方面提取、方面情感分类和意见提取。上述单个子任务或两个子任务的组合都有许多求解器,但是以前ABSA的研究都没有完整的解决方案。在本文中,我们介绍了ABSA下的一个新子任务,称为方面情感三元组抽取(ASTE),此任务的求解需要从输入中提取三元组(what,how,why),以显示目标方面是什么,其情感极性如何,以及为什么具有这种极性(即观点的原因)。

亮点

我们提出了一个两阶段的框架来解决这个任务。第一阶段预测统一模型中的what、how和why,然后第二阶段将预测的what(how)和why配对。在实验中,我们的框架为这项新颖的方面情感三元组抽取任务设定了基准性能,同时它的性能优于一些采用最新技术的强基准。

模型框架

对于给定的句子x,我们的目标是抽取到情感三元组(what,how,why)。我们采用两阶段的训练过程。第一阶段包括2个序列标注子任务,分别用来标注句中的方面、情感提及词和观点词语。第二阶段中我们使用第一阶段标注得到的方面词与观点词配对,使用距离嵌入的方式捕获正确配对的三元组信息。示意图见下图:

两段训练过程

具体模型两段阶段示意图如下:

第一阶段:我们首先将句子通过BLSTM编码,之后使用BIESO标注句中方面词边界,训练损失为 。如此训练的隐藏层再经过第二层的BLSTM层以及门控机制标注词方面情感极性词(SC),同时使用边界保证模块(BG)保证对应的边界词正确标注,此时得到的标注为 ;同时整合另一条分之中下情感标注词的特征表示,经过线性变换后softmax层后也可以得到标注 。则最终的统一方面词语标注结果为: ,其中为两者的调和系数,训练损失为 。另一分之中对于观点词语抽取我们使用GCN抽取句子结构信息与经过BLSTM抽取的句子信息拼接一起后经过softmax做情感词语标注(TG),此阶段训练损失为。经过GCN后的编码信息再经过一次BLSTM层做情感词序列标注,此阶段损失为 。最终模型训练损失为:

第二阶段:从第一阶段得到的方面词和情感词两两组合可以得到所有的情感方面三元组。我们利用方面词和情感词的绝对距离编码为它们之间的位置相对关系信息。再使用二分类判断当前三元组是否正确。示意图可以见表1。

实验

我们使用SemEval2014数据集,具体实验数据如下表所示:

我们分别验证了第一阶段和第二阶段的结果,来证明我们每一阶段设计的有效性。每段实验结果如下图所示。

总结

我们引入情感三元组抽取任务,通过在两个阶段的框架中结合方面提取、方面项情感分类和意见项提取,来回答方面是什么、情感如何以及为什么是这样的感觉。第一阶段通过利用方面和观点术语之间的相互影响,生成具有情感极性和观点术语的候选词语。第二阶段将正确的方面和观点配对。实验验证了我们模型的可行性和有效性,并为此任务设定了基准性能。


OpenKG

开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,进入 OpenKG 博客。

论文浅尝 - ICLR2020 | 知道什么、如何以及为什么:基于方面的情感分析的近乎完整的解决方案...相关推荐

  1. 论文浅尝 - ICLR2020 | You Can Teach an Old Dog New Tricks!关于训练知识图谱嵌入

    论文笔记整理:谭亦鸣,东南大学博士生. 来源:ICLR2020 链接:https://openreview.net/pdf?id=BkxSmlBFvr KG embedding(KGE)模型的目标是学 ...

  2. 论文浅尝 - ICLR2020 | 具有通用视觉表示的神经机器翻译

    论文笔记整理:柏超宇,东南大学在读硕士. 来源:ICLR2020 https://openreview.net/forum?id=Byl8hhNYPS 代码链接:https://github.com/ ...

  3. 论文浅尝 - ICLR2020 | Pretrained Encyclopedia: 弱监督知识预训练语言模型

    论文笔记整理:陈想,浙江大学博士,研究方向为自然语言处理,知识图谱. Wenhan Xiong, Jingfei Du, William Yang Wang, Veselin Stoyanov.Pre ...

  4. 论文浅尝 - ICLR2020 | 用于半监督分类的图形推理学习

    论文笔记整理:周虹廷,浙江大学研究生.研究方向:知识图谱,图表示学习等. 论文链接:https://arxiv.org/pdf/2001.06137.pdf 本文是发表在ICLR2020上针对图数据做 ...

  5. 论文浅尝 - ICLR2020 | 知识图谱中数值规则的可微学习

    论文笔记整理:许泽众,浙江大学博士研究生.研究方向:知识图谱,规则挖掘等. 论文链接:https://openreview.net/pdf?id=rJleKgrKwS 本文解决的是规则的学习问题,学习 ...

  6. 论文浅尝 - ICLR2020 | 通过神经逻辑归纳学习有效地解释

    论文笔记整理:朱渝珊,浙江大学直博生.研究方向:知识图谱,快速表示学习等. 论文链接:https://arxiv.org/pdf/1910.02481.pdf 本文是ICLR 2020的一篇关于知识图 ...

  7. 论文浅尝 - ICLR2020 | Abductive Commonsense Reasoning

    论文笔记整理:毕祯,浙江大学硕士,研究方向:知识图谱.自然语言处理.   链接:https://arxiv.org/pdf/1908.05739.pdf 动机 尽管长期以来人们一直认为归因是人们在自然 ...

  8. 论文浅尝 | ICLR2020 - 基于组合的多关系图卷积网络

    论文笔记整理:吴锐,东南大学计算机学院硕士. 来源:ICLR 2020 链接:https://arxiv.org/pdf/1911.03082.pdf 动机 目前针对于GCN的研究大多数都关注在学习无 ...

  9. 论文浅尝 | 神经网络与非神经网络简单知识问答方法的强基线分析

    来源:NAACL 2018 链接:http://aclweb.org/anthology/N18-2047 本文关注任务为面向简单问题的知识库问答(仅用KB中的一个事实就能回答问题).作者将任务划分为 ...

最新文章

  1. js和html以及css的区别,html、css、js中的区别与关系
  2. Swift3.0语言教程字符串与文件的数据转换
  3. Python 案例001 (有四个数字:1、2、3、4,能组成多少个互不相同且无重复数字的三位数)...
  4. 解决JBoss只能通过localhost访问不能通过IP的问题
  5. Kafka单机、集群模式安装详解(一)
  6. 谷歌浏览器修复一键修复_谷歌发布Chrome 86.0.4240.198 修复两个零日漏洞 - Google Chrome 谷歌浏览器...
  7. BZOJ 3144 [Hnoi2013]切糕
  8. 链表面试题1:反转单链表,不带头结点。
  9. 招商银行信用卡中心华泰证券暑期实习软开笔试小结
  10. Mac 下使用 homebrew 切换不同版本 php
  11. extjs mysql_ExtJS与PHP、MySQL实现存储
  12. JAVA 内部类(innerclasses)
  13. ida 反编译 php,飘云阁安全论坛在IDA pro中的这样一段反编译代码能够改写成易语言吗 - Powered by Discuz!...
  14. 什么是ESAM安全模块
  15. 世界首富马斯克的编程水平怎么样?
  16. 照片宽高比怎么设置_【经验分享】照片处理
  17. android switch 使用
  18. 下跌趋势底背驰的几种经典信号
  19. 轻松掌握Logstash的grok匹配
  20. syntastic 和 pathogen 安装使用

热门文章

  1. Android开发实践:常用NDK命令行参数
  2. jsp 连接MS server 数据库的例子
  3. c++现在有一棵合法的二叉树,树的节点都是用数字表示,现在给定这棵树上所有的父子关系,求这棵树的高度
  4. C语言结构体用法很多,坑也很多
  5. Android binder 框架和学习资料
  6. STM32——ADC
  7. rabbitmq如何保证消息不被重复消费_如何保证消息不被重复消费
  8. 【Pytorch神经网络理论篇】 10 优化器模块+退化学习率
  9. 解决loaded more than 1 DLL from .libs和No metadata found in lib\site-packages两个错误
  10. LeetCode 2140. 解决智力问题(动态规划)