本文提炼自“Beneath the Tip of the Iceberg: Current Challenges and New Directions in Sentiment Analysis Research”,作者:Soujanya Poria, Devamanyu Hazarika, Navonil Majumder, Rada Mihalcea
原文链接:https://arxiv.org/pdf/2005.00357

前言

情感分析的研究已经走过了近20年,它在市场,风险管理,市场研究和政治等各个领域都有广泛的商业应用。鉴于其在特定子任务(如情感极性分类)和数据集中的饱和度,人们有一个潜在的认识,即该领域已经成熟。本文讨论了该领域现存的问题和尚未发掘的研究方向,为该领域未来的发展提供一些新思路。

领域介绍

情感分析(也称为观点挖掘)是一个旨在了解非结构化内容基本情感的研究领域。举个例子,“John dislikes the camera of iPhone 7”[1],在这句话中John是一位观点持有者,并且通过这句话反映了他对这个iphone相机的负面评价。情感分析经历了很长的一个发展历程,如下图 Fig 3 所示。早期的情感分析首先是 Wiebe 等人[2, 3]对于句子中人为主观臆断的分析,之后词袋模型的思想出现之后,Turney[4]开创性地提出人们的文字评价内容根据其中的情感分为不同的类别,其中他设计了几种句法规则,以便处理。

事实上,情感分析领域也就是2000年左右的时候开始变得热门的,因为领域里相关任务逐渐被定义,人们受启发想出了更多的处理方法,并且评价方法和细节也变多了。但是,人们后来发现,简单地统计情感极性词汇效果并不好,因为来自同一个人的情绪往往会有变化,但是常识上来说,我们都会以最新的为主,而词袋模型相关方法忽略了这个。因此Polanyi等人[5, 6]提出了基于考虑上下文的情感分析方法,使得用户的观点情感变化轨迹得到追踪。之后,SentiWordNet[7]的提出给我们提供了大量确定情感极性的关键词,这个字典里的每个词汇都对应一种情感极性,积极或是消极,还有积极度和消极度的一个打分。再往后是情感特定的wording embedding[8, 9],这些都用到了机器学习的一些思想。之后就是深度学习的时代了,基于CNN, RNN还有BERT等技术,情感分析进入了新的时代,也遭遇了新的瓶颈。其中一方面是,很多情感分析任务及数据集的SOTA方法都已经达到了非常极高的效果,提升空间变得有限,情感分析的基础任务已经没有多大变化了。

Fig 1 展示了目前SOTA方法在几种热门数据集中的效果。

展望未来

回顾过去的研究,主要是基于规则的、基于词法的、借助机器学习和深度学习的情感分析。我们更感兴趣的是未来还有什么可挖掘的方向,能够继续推动情感分析的发展。Fig 2 通过一个图表,展示了本文作者猜想的未来可尝试的方向。在此,我们选择其中几个简单提一提,第一个是把情感分析放到多模态处理任务之中,比方说文字结合图像,文字结合视频分析,通过图像和视频,我们能察觉到人物的表情和神态,这些都提供了生动的情感态度。第二个是情感推理,比如找出情感态度相关的人物,并且考虑人物之间的相互作用。另一个就是情感文字生成了,比方说共情对话系统,facebook近年刚好也提供了高质量的数据集[10]。第三个是对情感要素进行更细粒度的分析理解,以及提出这些新的情感分析评价方法。Fig 4和Fig 5举出了几个对话情感分析的例子。虽然情感分析作为基础任务已经显得过时了,但是融入到近年热门的对话系统、推荐系统中,有助于开发出更加智能化和人性化的服务产品。

总结

本文中作者总结了情感分析20多年来的发展历程,提到了现存任务中遭遇的瓶颈,并且详细讨论了未来可以进一步研究的新思路。本文认为,情感分析还有很多有待解决的问题,当下对领域已经饱和的看法主要是过多的出版物体现的,目前的情感分析都还停留在表面,有待进一步研究。随着时代的变化和技术的进步,未来有待进一步将情感分析研究落实到实际产品和科技服务之中。

参考资料

[1] Liu, B. Sentiment Analysis and Opinion Mining. Synthesis Lectures on Human Language Technologies. Morgan & Claypool Publishers, 2012.

[2] Wiebe, J. M. Tracking point of view in narrative. Computational Linguistics, 20(2):233–287, 1994.

[3] Wiebe, J. M., Bruce, R. F., and O’Hara, T. P. Development and use of a gold-standard data set for subjectivity clas- sifications. In Proceedings of the 37th annual meeting of the Association for Computational Linguistics on Computational Linguistics, pp. 246–253. Association for Computational Linguistics, 1999.

[4] Turney, P. D. Thumbs up or thumbs down? semantic orien- tation applied to unsupervised classification of reviews. In Proceedings of the 40th Annual Meeting of the Association for Computational Linguistics, July 6-12, 2002, Philadelphia, PA, USA, pp. 417–424. ACL, 2002.

[5] Polanyi, L. and Zaenen, A. Contextual valence shifters. In Computing attitude and affect in text: Theory and applications, pp. 1–10. Springer, 2006.

[6] Hu, M. and Liu, B. Mining and summarizing customer reviews. In Proceedings of the tenth ACM SIGKDD international conference on Knowledge discovery and data mining, pp. 168–177. ACM, 2004b.

[7] Esuli, A. and Sebastiani, F. SENTIWORDNET: A publicly available lexical resource for opinion mining. In Proceedings of the Fifth International Conference on Language Resources and Evaluation, LREC 2006, Genoa, Italy, May 22-28, 2006, pp. 417–422. European Language Resources Association (ELRA), 2006.

[8] Tang, D., Wei, F., Yang, N., Zhou, M., Liu, T., and Qin, B. Learning sentiment-specific word embedding for twitter sentiment classification. In Proceedings of the 52nd Annual Meeting of the Association for Computational Linguistics (Vol- ume 1: Long Papers), volume 1, pp. 1555–1565, 2014.

[9] Maas, A. L., Daly, R. E., Pham, P. T., Huang, D., Ng, A. Y., and Potts, C. Learning word vectors for sentiment analysis. In Proceedings of the 49th annual meeting of the association for computational linguistics: Human language technologies- volume 1, pp. 142–150. Association for Computational Linguistics, 2011.

[10] Hannah Rashkin, Eric Michael Smith, Margaret Li, and Y-Lan Boureau. 2019. Towards empathetic open-domain conversation models: A new benchmark and dataset. In Proceedings of the 57th Annual Meeting of the Association for Computational Linguis- tics, pages 5370–5381, Florence, Italy. Association for Computational Linguistics.

情感分析研究:还未结束!相关推荐

  1. 基于AdaBoost算法的情感分析研究

    源码下载 http://www.byamd.xyz/hui-zong-1/ 基于AdaBoost算法的情感分析研究 摘 要 随着互联网的快速发展,各类社交媒体平台如微信.QQ等也与日俱增,而微博更是集 ...

  2. 情感分析研究的新视野

    2020-05-15 10:52:46 作者:Caroline Brun 编译:ronghuaiyang 导读 对情感分析研究领域做了非常好的总结和展望. 假新闻.受欢迎程度.健康状况.金融和社会风险 ...

  3. 总结和展望:情感分析研究的新视野

    作者:Caroline Brun     编译:ronghuaiyang 导读 本文对情感分析研究领域做了非常好的总结和展望. 假新闻.受欢迎程度.健康状况.金融和社会风险:情感分析正在帮助理解这一切 ...

  4. python毕业设计开题报告-基于python爬虫的影评情感分析研究开题报告

    论文(设计)题目 基于python爬虫的影评情感分析研究开题报告 选题的背景.意义及研究现状: 研究现状: 文本情感分析又称倾向性分析.情感挖掘,主观分析或评论挖掘,是对带有情感色彩的评论文本内容进行 ...

  5. (五十二):多模态情感分析研究综述_张亚洲

    (五十二):多模态情感分析研究综述_张亚洲 Abstract 1 叙述式多模态情感分析 1. 1 静态多模态情感分析(文本与图像划分为静态文档) 1. 1. 1 基于机器学习的方法 1. 1. 2 基 ...

  6. 多模态情感分析研究综述 论文笔记

    这里写目录标题 论文标题 引言 论文学术结构 1.总体介绍 2.介绍叙述式多模态情感分析 3.介绍交互式多模态情感分析 4.多模态情感分析存在的交互建模科学问题 5.结束语 阅读论文初体验 思维导图 ...

  7. 面向社交媒体的多模态属性级情感分析研究

    每天给你送来NLP技术干货! 分享嘉宾:虞剑飞 南京理工大学 副教授 编辑整理:路人 复旦大学 出品平台:DataFunTalk 导读:随着社交网络的飞速发展,人们在以微博.Twitter为代表的社交 ...

  8. 阅读:面向电子商务的评论文本情感分析研究

    主题:评论文本的情感分析(倾向性分析.观点识别.意见挖掘.情感分类) 一.两种方法:基于语义,基于机器学习. 1.基于语义: 国外:(支持向量机(SVM)和贝叶斯算法具有较好的情感分类效果). 国内: ...

  9. 细粒度情感分析:还在用各种花式GNN?或许只用RoBERTa就够了

    点击上方"AI遇见机器学习",选择"星标"公众号 重磅干货,第一时间送达 来自 | 知乎 作者 | 邱锡鹏 地址 | https://zhuanlan.zhih ...

最新文章

  1. 如何扩展Linux的ip_conntrack
  2. getResources()方法
  3. VTK一个面向对象的可视化类库
  4. C++动态链接库的制作
  5. qt android文件读写文件,qt android 开发之写入xml配置文件篇
  6. 随想录(功能安全和软件开发)
  7. 计算机专业学微机原理与接口技术,信息技术学院计算机科学与技术专业《微机原理与接口技术.doc...
  8. sketchup生成面域插件_适用于Revit / SketchUp / Rhino / ArchiCAD插件最新版
  9. NODE_多文件上传
  10. 最小二乘法和主成分分析的比较 matlab  儿子的papa
  11. 服务器安全狗Windows V5.0正式版
  12. 理解ESP32 Flash烧写的DOUT/DIO/QOUT/QIO配置
  13. Codeforces Global Round 7 E. Bombs(线段树)
  14. 尚硅谷设计模式学习(1)---[设计模式七大原则]
  15. 165页最全银行IT核心系统研究框架
  16. 【Python妙用】用200行Python代码制作一个迷宫小游戏
  17. 第二章 预习导图 部署DNS服务
  18. 人人站CMS缓存过大清理方法
  19. 电脑软件:UPDF - 高效率高颜值的PDF编辑器
  20. C#读写各型号西门子PLC

热门文章

  1. 计算机aoa综合题word,AOA-word综合题操作步骤(修正版)
  2. 一文教会你什么线程安全以及如何实现线程安全
  3. 2021-01-24过去十年十大AI研究热点,分别为深度神经网络、特征抽取、图像分类、目标检测、语义分割、表示学习、生成对抗网络、语义网络、协同过滤和机器翻译。
  4. MinMaxScaler.fit 归一化数据的方法
  5. Attention机制总结 看明白了的
  6. 名校 Stanford
  7. 跨境电子商务B2B出口新政简析
  8. 有奖话题讨论:你的互联网从业故事
  9. ASP.NET之父谈ASP.NET AJAX
  10. starGAN原理代码分析