NLP研究方向的「情感分析领域」的简单调研
情感分析领域相关内容,非正式综述,仅供参考。有些链接在可能在微信文章失效,请点击阅读原文获取。
(https://blog.csdn.net/DoJintian/article/details/88356413)
简介
情感分析或观点挖掘是对人们对产品、服务、组织、个人、问题、事件、话题及其属性的观点、情感、情绪、评价和态度的计算研究。
现有研究已经产生了可用于情感分析多项任务的大量技术,包括监督和无监督方法。在监督方法中,早期论文使用所有监督机器学习方法(如支持向量机、最大熵、朴素贝叶斯等)和特征组合。无监督方法包括使用情感词典、语法分析和句法模式的不同方法。现有多本综述书籍和论文,广泛地涵盖了早期的方法和应用。
大约十年前,深度学习成为强大的机器学习技术,在很多应用领域产生了当前最优的结果,包括计算机视觉、语音识别、NLP 等。近期将深度学习应用到情感分析也逐渐变得流行。
情感分析的三种粒度
文档粒度(document level):文档级情感分类是指为观点型文档标记整体的情感倾向/极性,即确定文档整体上传达的是积极的还是消极的观点。因此,这是一个二元分类任务,也可以形式化为回归任务,例如为文档按 1 到 5 星评级。一些研究者也将其看成一个五类分类任务。
句子粒度(sentence level):语句级情感分类用来标定单句中的表达情感。正如之前所讨论的,句子的情感可以用主观性分类和极性分类来推断,前者将句子分为主观或客观的,而后者则判定主观句子表示消极或积极的情感。在现有的深度学习模型中,句子情感分类通常会形成一个联合的三类别分类问题,即预测句子为积极、中立或消极。
短语粒度(aspect level):也称为主题粒度,每一个短语代表了一个主题。与文档级和语句级的情感分类不同,aspect level 情感分类同时考虑了情感信息和主题信息(情感一般都会有一个主题)。给定一个句子和主题特征,aspect level 情感分类可以推断出句子在主题特征的情感极性/倾向。例如,句子「the screen is very clear but the battery life is too short.」中,如果主题特征是「screen」,则情感是积极的,如果主题特征是「battery life」,则情感是消极的。
深度学习模型
文档/句子粒度:Kim等人(2013) 提出的CNN文本分类工作,成为句子级情感分类任务的重要baseline之一;
文档/句子粒度:基本的lstm模型加上pooling策略构成分类模型,是通常用来做情感分析的方法;
短语粒度:Tang等人(2015) 使用两种不同的rnn网络,结合文本和主题进行情感分析;
短语粒度:Tang等人(2016) 结合memory-network,解决target-dedependent问题,这里的target理解为前面提过的aspect;
短语粒度:Chen等人(2017) 分别使用位置权重记忆和层叠attention的复合机制,建模target词和文本间的相互交互关系,以解决短语级情感分类问题;
短语粒度:Schmitt1等人(2018) 将aspect和polarity结合在一起进行分类任务训练,得到情感分析的模型;
现在流行模型:大规模语料预训练(词向量/Elmo/GPT/Bert)+ 深度学习分类器(lstm/cnn/transformer),一个很好的示例见AI Challenger 2018:细粒度用户评论情感分类冠军思路总结。
相关数据
情感词典
词性字典1 词性字典2
大连理工大学中文情感词汇本体库
清华大学李军中文褒贬义词典
知网情感词典
情感数据集
15 Free Sentiment Analysis Datasets for Machine Learning
大众点评细粒度用户评论情感数据集
汽车行业用户观点主题及情感识别
电商评论情感数据
酒店评论语料
SemEval-2014 Task 4数据集
Citysearch corpus 餐馆评论数据
NLPCC2014评估任务2_基于深度学习的情感分类
NLPCC2013评估任务_中文微博观点要素抽取
NLPCC2013评估任务_中文微博情绪识别
NLPCC2013评估任务_跨领域情感分类
NLPCC2012评估任务_面向中文微博的情感分析
康奈尔大学影评数据集
其他资源
[Sentiment Analysis with LSTMs in Tensorflow](https://github.com/adeshpande3/LSTM-Sentiment-Analysis )
Sentiment analysis on tweets using Naive Bayes, SVM, CNN, LSTM, etc.
Chinese Shopping Reviews sentiment analysis
AI Challenger 2018:细粒度用户评论情感分类冠军思路总结
文献资料
文本情感分析综述(腾讯语义团队)
Deep learning for sentiment analysis: A survey
情感分析资源大全
Tang D, Qin B, Liu T. Aspect level sentiment classification with deep memory network[J]. arXiv preprint arXiv:1605.08900, 2016.
Kim Y. Convolutional neural networks for sentence classification[J]. arXiv preprint arXiv:1408.5882, 2014.
https://blog.csdn.net/DoJintian/article/details/88356413
请关注和分享↓↓↓
机器学习初学者
QQ群:727137612
(注意:本站有7个qq群,加入过任何一个的不需要再加)
本站的知识星球ID:92416895
往期精彩回顾
良心推荐:机器学习入门资料汇总及学习建议(2018版)
黄海广博士的github镜像下载(机器学习及深度学习资源)
吴恩达老师的机器学习和深度学习课程笔记打印版
机器学习小抄-(像背托福单词一样理解机器学习)
首发:深度学习入门宝典-《python深度学习》原文代码中文注释版及电子书
科研工作者的神器-zotero论文管理工具
机器学习的数学基础
机器学习必备宝典-《统计学习方法》的python代码实现、电子书及课件
吐血推荐收藏的学位论文排版教程(完整版)
机器学习入门的百科全书-2018年“机器学习初学者”公众号文章汇总
NLP研究方向的「情感分析领域」的简单调研相关推荐
- NLP自然语言处理之情感分析分析讲解、知识构建
!!!!!!不要急着代码,搞清楚原理知识结构才下手,以后还指着它吃饭呢,又不是水一篇论文当混子!!!!!!! !!!!!!书越读越薄,本文源自:https://blog.csdn.net/linxid ...
- 重磅发布!36氪中国新基建之王「大数据领域」TOP50企业揭晓
后信息技术时代,谁是数据海里的小白条? 制榜 | 贺卓媛 制图 | 王茹 出品 | 36氪创投研究院 封面来源 | IC photo 全球逐步进入以"数字化"为代表的后信息技术时代 ...
- 【API进阶之路】帮公司省下20万调研费!如何巧用情感分析API实现用户偏好调研
上次借着高考热点整出一个刷屏的互动游戏之后,我连续被各业务部门请了一周的午饭了,今天运营部,明天品牌部,后天市场部-心里暗搓搓地想,这业务部门的团建经费咋就这么多呢? (详情请查看上集:<高考要 ...
- AI学习笔记(十八)NLP常见场景之情感分析
目录 情感分析 基于情感词典的传统算法 基于深度学习的算法 情感分析 情感分析是自然语言处理中常见的场景,对于指导产品更新迭代具有关键性的作用. 通过情感分析,可以挖掘产品在各个维度的优劣,从而明确如 ...
- Tensorflow 笔记 Ⅺ——NLP 实现电影评论情感分析
文章目录 特别说明 数据集 IMDB 简介 IMDB 数据集 下载地址 目录结构 示例文本 自然语言处理基础 分词 词的数字化表示方法与词嵌入 循环神经网络 RNN与LSTM 数据的时序与含义 RNN ...
- 新手探索NLP(七)——情感分析
简介 文本情感分析(sentiment analysis),又称为意见挖掘,是对带有情感色彩的主观性文本进行分析.处理.归纳和推理的过程.其中,主观情感可以是他们的判断或者评价,他们的情绪状态,或者有 ...
- [NLP]基于IMDB影评情感分析之BERT实战-测试集上92.24%
系列文章目录 深度学习NLP(一)之Attention Model; 深度学习NLP(二)之Self-attention, Muti-attention和Transformer; 深度学习NLP(三) ...
- NLP自然语言处理-Pytorch情感分析简介
一.概念简介 本质上是一个分类任务,其一般是指判断一段文本所表达的情绪状态.其中,一段文本可以是一个句子,一个段落或一个文档.情绪状态可以是两类,如(正面,负面),(高兴,悲伤):也可以是三类,如(积 ...
- 使用NLP库textblob进行情感分析-红楼梦评论
最近做了一个分析国外读者对红楼梦评价的小项目.这部分是使用textblob库对评论进行情感分析,得到情感值,并且进行分类,生成词云. 生成直方图.条形图的数据分析过程见我的这篇文章 读入的数据是这样的 ...
最新文章
- 再见 Win10!下一代操作系统要来了!
- tf.metrics.accuracy
- 网络:TCP粘包问题?如何解决?
- 清理Win7系统的批处理
- linux vim配置怎么打开文件,Linux如何设置默认VIM打开文件
- three.js script vertex和fragment在react中使用/纯js写法
- Oracle/MySQL decimal/int/number 转字符串
- Highlighting高亮插件使用说明
- kettle-连接mysql数据库
- layui 导航栏设置无鼠标停留特效_五款最受欢迎的热门wordpress开源主题 - 博客、导航...
- 解决XP IIS连接访问人数限制的问题
- python 回溯法 01背包问题_Python基于回溯法解决01背包问题实例
- 程序员月薪3万?2020年12月程序员平均薪资14222元,招聘近40万人!
- 【蓝桥杯专题】 贪心(C++ | 洛谷 | acwing | 蓝桥)
- 免费双因素身份认证服务
- Caj转pdf有哪些不收费的转换方法?
- 新浪sina gitlab邮件收不到
- Android Camera(一):camera模组CMM介绍
- 小程序如何分享到朋友圈,实现裂变
- ngrok 内网穿透+实现远程桌面