情感分析资源 (转)

中文的 http://wenku.baidu.com/view/819b90d676eeaeaad1f3306e.html

情感词典
1.知网的情感词典
- http://www.keenage.com/html/c_bulletin_2007.htm
由知网发布的词典,包括中文情感词典和英文情感词典

(以下需要论坛积分)

2.台湾大学的情感极性词典
- http://www.datatang.com/data/11837
包括2810个正极性词语和8276个负极性词语。准确度很高

情感分析语料
3.酒店评论语料
- http://www.datatang.com/data/11936 
谭松波整理的一个较大规模的酒店评论语料。
语料规模为10000篇。语料从携程网上自动采集,并经过整理而成。

4.豆瓣网影评情感测试语料
- http://www.datatang.com/data/13539 
来自豆瓣网对电影《ICE AGE3》的评论,评分标准均按照5 stars评分在网页中有标注。语料至527页。每页20条短评。共计11323条评论

5.酒店、电脑与书籍的评论语料
- http://www.datatang.com/data/11937
数据量不太大,也有一些重复的数据

6.评论网页数据集
- http://www.datatang.com/data/12044
数据量不小,包括的电影和评论都不少

--------------------------------------------------------------------------------------

文本情感分析综述∗赵妍妍+, 秦兵, 刘挺

4.2 情感分析的资源建设
4.2.1 情感分析的语料

1.(可下载) 康奈尔大学(Cornell)提供的影评数据集(http://www.cs.cornell.edu/people/pabo/movie-review-data/):由电影评论组成,其中持肯定和否定态度的各1,000 篇;另外还有标注了褒贬极性的句子各5,331 句,标注了主客观标签的句子各5,000 句.目前影评库被广泛应用于各种粒度的,如词语、句子和篇章级情感分析研究中.
2. 伊利诺伊大学芝加哥分校(UIC)的Hu 和Liu 提供的产品领域的评论语料:主要包括从亚马逊和Cnet 下
载的五种电子产品的网络评论(包括两个品牌的数码相机,手机,MP3 和DVD 播放器).其中他们将这些语料按句
子为单元详细标注了评价对象,情感句的极性及强度等信息.因此,该语料适合于评价对象抽取和句子级主客观
识别,以及情感分类方法的研究.此外,Liu 还贡献了比较句研究[74]方面的语料.
3. (可下载)Janyce Wiebe 等人所开发的MPQA(Multiple-Perspective QA)库:包含535 篇不同视角的新闻评论,它是一个进行了深度标注的语料库.其中标注者为每个子句手工标注出一些情感信息,如观点持有者,评价对象,主观表达式以及其极性与强度.文献[75]描述了整个的标注流程.MPQA 语料适合于新闻评论领域任务的研究.
4. 麻省理工学院(MIT)的Barzilay 等人构建的多角度餐馆评论语料:共4,488 篇,每篇语料分别按照五个角
度(饭菜,环境,服务,价钱,整体体验)分别标注上1~5 个等级.这组语料为单文档的基于产品属性的情感文摘提供
了研究平台.
5. 国内的中科院计算所的谭松波博士提供的较大规模的中文酒店评论语料:约有10,000 篇,并标注了褒贬
类别,可以为中文的篇章级的情感分类提供一定的平台.

4.2.2 情感分析的词典资源
情感分析发展到现在,有不少前人总结出来的情感资源,大多数表现为评价词词典资源.
1. GI(General Inquirer)评价词词典(英文,http://www.wjh.harvard.edu/~inquirer/).该词典收集了1,914 个褒义词和2,293 个贬义词,并为每个词语按照极性,强度,词性等打上不同的标签,便于情感分析任务中的灵活应用.
2. NTU 评价词词典(繁体中文).该词典由台湾大学收集,含有2,812 个褒义词与8,276 个贬义词[76].
3.(可下载) 主观词词典(英文,http://www.cs.pitt.edu/mpqa/).该词典的主观词语来自OpinionFinder 系统,该词典含有8,221 个主观词,并为每个词语标注了词性,词性还原以及情感极性.
4. (可下载)HowNet 评价词词典(简体中文、英文,http://www.keenage.com/html/e_index.html).该词典包含9,193 个中文评价词语/短语, 9,142 个英文评价词语/短语,并被分为褒贬两类.其中,该词典提供了评价短语,为情感分析提供了更丰富的情感资源.

情感分析语料库——情感词典(中文英文)转相关推荐

  1. python英文文本情感分析_sentimentpy模块进行中文文本情感分类

    sentimentpy是我根据R语言的一个文本情感分析包sentiment进行开发的, 开发的初衷有: R的sentiment已经被弃坑, 没人维护 Python比R更擅长文本处理 sentiment ...

  2. python情感分析语料库_利用Python实现中文情感极性分析

    情感极性分析,即情感分类,对带有主观情感色彩的文本进行分析.归纳.情感极性分析主要有两种分类方法:基于情感知识的方法和基于机器学习的方法.基于情感知识的方法通过一些已有的情感词典计算文本的情感极性(正 ...

  3. python情感分析语料库_python 中文情感分析 Snownlp库的使用

    不甘心的时候,就是在进步:痛苦的时候,就是在成长. 文章目录 一.Snownlp 简介 SnowNLP是一个python写的类库,可以方便的处理中文文本内容,是受到了TextBlob的启发而写的,由于 ...

  4. java 情感分析_Flink基于Alink中文情感分析示例(Java版本)

    Alink是基于Flink的机器学习算法平台,欢迎访问Alink的github获取下载链接及更多信息. alibaba/Alinkgithub.com 情感分析是对带有情感色彩(褒义贬义/正向负向)的 ...

  5. 情感分析 | 细粒度情感分析在美团到餐场景中的应用

    每天给你送来NLP技术干货! 来自:美团技术团队 经典的细粒度情感分析(ABSA,Aspect-based Sentiment Analysis)主要包含三个子任务,分别为属性抽取.观点抽取以及属性- ...

  6. python snownlp情感分析_SnowNLP情感分析+生成词云

    本帖最后由 missy 于 2017-12-9 00:12 编辑 因为最近看了一下<致我们单纯的小美好>,虽然情节是有点"二"吧,但是看了觉得真的很怀念初高中的日子,一 ...

  7. pytreebank︱情感分析可视化——情感结构树

    效果如上,一句话用树状来表达,具体案例可查询stanford Sentiment Analysis网站 如何用py来画,主要参考自pytreebank-github 1 直接上案例,官网案例数据下载: ...

  8. pyhanlp 文本分类与情感分析

    这一次我们需要利用HanLP进行文本分类与情感分析.同时这也是pyhanlp用户指南的倒数第二篇关于接口和Python实现的文章了,再之后就是导论,使用技巧汇总和几个实例落.真是可喜可贺啊. 文本分类 ...

  9. python中文情感分析分类和英文情感分析的库和方法汇总

    情感分析是自然语言处理中的一个常见任务.以下是用 Python 写的一个简单的情感分析分类函数的代码示例: import jieba import numpy as npdef sentiment_a ...

  10. 中文文本情感分类及情感分析资源大全

    摘要:20世纪初以来,文本的情感分析在自然语言处理领域成为了研究的热点,吸引了众多学者越来越多的关注.对于中文文本的情感倾向性研究在这样一大环境下也得到了显著的发展.本文主要是基于机器学习方法的中文文 ...

最新文章

  1. 解决 rake aborted!
  2. java 时间衰减函数_TensorFlow实现指数衰减学习率的方法
  3. Linux下安装Redis及搭建主从
  4. remove()方法
  5. H5 移动端 获取腾讯地图计算两经纬度的实际距离(可批量)_多地打卡
  6. yolov5训练自己的数据集(一文搞定训练)
  7. 为什么要使用 dns-prefetch
  8. 毕业从事汽车行业,转行测试工程师,3个月完成了蜕变,我很满意...
  9. 获取类路径的方法之一
  10. [转]coolfire黑客入门教程系列之(三)
  11. oracle ntile函数,Oracle分析函数ntile
  12. uniapp中引入colorUI
  13. python——爬虫豆瓣250
  14. 知识推理——正向链接推理
  15. 【LeetCode】233. 数字 1 的个数
  16. Redis ZADD命令
  17. dede 修改首页默认访问路径/dede修改安装目录
  18. Allegro器件添加 no prob区域操作指导
  19. ZigBee应用于油田数字化建设
  20. ABF平台设计(四):体验黑科技-结构化的体验数据平台

热门文章

  1. s2jh mysql_mysql 一对多 查询 出一行数据
  2. java中访问权限控制顺序_Java中的四种访问权限控制 | 学步园
  3. php 计算签名,php – 计算Amazon Marketplace API的签名问题
  4. System与Runtime类
  5. 请问投稿中要求上传的author_SCI投稿状态解析
  6. mybatis单元测试(无需启动容器)
  7. Angr安装与使用之使用篇(九)
  8. (1)关于File类你知道多少
  9. 【Uva 1633】Dyslexic Gollum
  10. Harvest: A high-performance fundamental frequency estimator from speech signals