论文阅读 2020

1. 解决问题

将幽默等级识别为自然语言推理任务,将幽默文本划分为铺垫和笑点两部分,提出对两者之间的关系进行建模可以显著提升模型识别幽默等级的性能。

2. 创新点(贡献)

  • 本文基于多种嵌入表示融合的幽默文本表示,提出了一种基于局部和全局语义理解的神经 网络模型,分别从单词级别和子句级别提取幽默文本特征。
  • 本文提出了一种基于交互语义关联特征的神经网络模型,对幽默文本中幜铺垫帢和幜笑点帢的 关联信息进行建模以抽取幽默语义关联特征。
  • 本文使用基于多粒度语义交互理解网络的幽默等级识别方法,在Reddit公开幽默数据集上 进行对比实验,结果表明,本文提出的方法能够有效地提升幽默等级识别的性能。

3. 前人方法的局限性

  • 将幽默文本作为整体进行建模,忽略了独立的语义信息和交互的关联信息;
  • 仅从单一粒提取幽默特征,性能会受到限制。

4. 本文使用的模型框架

  • CNN(Weller and Seppi,2019):采用CNN自动提取幽默语句的潜在语义特征并进行幽默等级识别。
  • CNN(Kim,2014):本文复现的基于幃幎幎的方法,使用3种不同尺寸卷积核的CNN提取幽默文本特征进行幽默等级识别。
  • LSTM:使用LSTM提取幽默特征并进行幽默等级识别。
  • Bi-LSTM-Attention:使用双向LSTM和注意力机制提取幽默文本特征,并对幽默等级进行识别.
  • Transformer:使用基于transformer结构的预训练模型对幽默文本整体做特征提取,以进行幽默等级识别。
  • Bert:本文复现的基于Bert方法的结果,在任务语料上做微调然后进行幽默等级识别。
  • ESIM:只基于局部语义交互信息进行幽默等级识别。
  • MSIN:本文提出的多粒度语义交互理解网络,综合使用语义嵌入、局部语义交互和全局 语义交互进行幽默等级识别

5. 这种方法的意义是什么(有什么好处)

引入幽默内部的语义关系信息可以提高模型幽默识别的性能,而本文提出的模型也可以很好地建模这种语义关系。

6. 实验数据

Reddit数据集,由Weller等在2019年构建,幽默语句来自Reddit中带有“humor”标签的文本,采用众包方式对幽默语句的“铺垫”和“笑点”进行了标注,且对幽默语句的强弱进行了人工标注

评价指标:精确率(Acc) , 准确率 ( P ), 查全率( R ), F1-Score

7. 实验效果


8. 总结

本文将幽默文本划分为铺垫和笑点两部分,提出对两者之间的关系进行建模可以显著提升 模型识别幽默等级的性能。基于这个观点,首先,本文在融合多种嵌入表示的基础上,从局 部和全局两个粒度来对幽默中的语义关系进行理解和建模。其次,本文对幽默中“铺垫”和“笑点”两部分的关联信息做交互建模,从而实现充分挖掘铺垫和笑点之间的关系。最后,本文 在Reddit幽默数据集上进行实验,取得了最优结果,同时结合消融实验证实了模型设计的有效 性。在以后的工作中,我们将在幽默文本自动切分及基于铺垫的笑点文本生成方面做更多的探 索。

基于多粒度语义交互理解网络的幽默等级识别相关推荐

  1. 「网络安全专利分析」一种基于多粒度异常检测的网络威胁评估方法

    就像是一场梦,醒来还是很感动,蛋黄的长裙,蓬松的头发,还是很想被你保护,我心里的惨痛.最近又是看论文.又是看专利,还要凑点时间来追剧,难搞哦. 和博士聊了一下得知可以在sci-hub上免费看论文 捣鼓 ...

  2. ACM MM 2018论文概述:基于多粒度监督的图像语义物体协同标注

    作者丨张立石.付程晗.李甲 学校丨北京航空航天大学 研究方向丨计算机视觉 介绍 本文概述了被 2018 年 10 月 ACM Multimedia 会议录用为 Oral 的论文:Collaborati ...

  3. 论文浅尝 - ACL2022 | 基于多语言语义解耦表示的跨语言迁移方法实现多语言阅读理解...

    论文作者:吴林娟,天津大学,研究方向为自然语言理解 论文链接:http://arxiv.org/abs/2204.00996 代码地址:https://github.com/wulinjuan/SSD ...

  4. python遥感影像地物分类_基于轻量化语义分割网络的遥感图像地物分类方法与流程...

    本发明属于图像处理 技术领域: ,特别涉及一种地物分类方法,可用于土地利用分析.环境保护以及城市规划. 背景技术: :遥感图像地物分类,旨在取代繁琐的人工作业,利用地物分类方法,得到输入遥感图像的地物 ...

  5. 酒厂酒业IP网络广播系统建设方案-基于局域网的新一代交互智慧酒厂酒业IP广播设计指南

    酒厂酒业IP网络广播系统建设方案-基于局域网的新一代交互智酒业酒厂IP广播系统设计指南 由北京海特伟业任洪卓发布于2023年4月25日 一.酒厂酒业IP网络广播系统建设需求 随着中国经济的快速稳步发展 ...

  6. nc65语义模型设计_文本匹配方法系列––多维度语义交互匹配模型

    摘要 本文基于接着多语义匹配模型[1]和BERT匹配模型[2]介绍一些多维度语义交互匹配模型,包括2017 BiMPM模型[3]和腾讯出品的2018 MIX[4].这些方法的核心特征都是在多语义网络的 ...

  7. 华南理工提出多模态ReID新数据集,语义自对齐网络SSAN达到SOTA性能!代码数据集均已开源!...

    关注公众号,发现CV技术之美 本篇分享论文『Semantically Self-Aligned Network for Text-to-Image Part-aware Person Re-ident ...

  8. 基于神经网络的机器阅读理解综述学习笔记

    基于神经网络的机器阅读理解综述学习笔记 一.机器阅读理解的任务定义 1.问题描述 机器阅读理解任务可以形式化成一个有监督的学习问题:给出三元组形式的训练数据(C,Q,A),其中,C 表示段落,Q 表示 ...

  9. ECCV2020 | 北京大学提出RGB-D语义分割新网络,多模态信息融合

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 这篇文章收录于ECCV2020,由北京大学.商汤科技.香港中文大学提出的基于RGB-D图像的语义分割算 ...

最新文章

  1. 对标Pytorch,清华团队推出自研AI框架“计图”
  2. 打架斗殴烫头酗酒抽烟的小混混,逆袭保送中国科学院,后来怎么样了?
  3. python字符串find函数-Python字符串的方法,查找和替换
  4. Ubuntu14.04安装中文输入法
  5. 腾讯业务监控的修炼之路
  6. 关于积累-accumulation
  7. [ZZ]Debug VBScript with Visual Studio
  8. 20172301 2017-2018-2《程序设计与数据结构》课程总结
  9. Mysql导入excel数据,解决某些特殊字符乱码问题
  10. Kibana未授权访问漏洞记录(CVE-2019-7609,Kibana的RCE,原型链污染,端口:5601)
  11. 开源、高质量QR码多语言生成库
  12. rfid 标签内存_智能仓库之RFID仓库管理中的条形码与电子标签应用-RFID仓库管理功能与特点-新导智能...
  13. MTK MODEM(1)--- MTK平台NV基本功能与操作
  14. 专访死马:为什么说Egg.js是企业级Node框架
  15. 【解决方案】客户端请求数据较大时,nginx返回数据被截断
  16. 塔设备设计手册_石油化工设备设计选用手册 塔器
  17. 【PL/SQL】 学习笔记 (3)if 语句使用
  18. better-scroll插件 api
  19. Windows 10 Insider Preview 预览版本19603发布
  20. 【触动精灵】开发手册学习整理(一)

热门文章

  1. 图片放大镜效果实现过程详解
  2. 第10章第18节:使用iSlide的全图幻灯片命令将所有内容都转为图片 [PowerPoint精美幻灯片实战教程]
  3. Java Class 加密工具 ClassFinal
  4. 使用opengles绘制灰度地形图
  5. 【蓝桥杯】研究兔子的土豪(Java实现)
  6. java 字节流设置编码方式_java字节流和字符流编码格式(转自姚刚)
  7. 诺基亚x6升级android9体验,诺基亚 X6 迎来安卓 9 Pie 测试版更新:这几个功能值得体验...
  8. python中偏函数的应用
  9. golang性能分析工具pprof介绍
  10. 云应用系统开发技术考点(面试题相关)