Python&Stata数据采集与数据分析实证前沿寒假工作坊  现在开始招生了,有兴趣的同学和老师可以戳进来了解

情绪和情感词典 是由加拿大国家研究委员会(简称NRC)的专家创建。该词典·具有广泛的应用程序开发,可以在多种环境中使用,例如情绪分析,产品营销,消费者行为,甚至是政治活动分析。

该技术使用一系列单词来帮助识别情绪,情感,并分析标签,表情符号和单词颜色的关联。这些词典包含英文单词的条目,可用于分析英文文本。

资源文件夹目录(文章末尾有完整的资源可供下载)

  • AutomaticallyGeneratedLexicons

  • NRC-Affect-Intensity-Lexicon

  • NRC-Colour-Lexicon-v0.92

  • NRC-Emotion-Lexicon-v0.92

  • NRC-VAD-Lexicon

但是我觉得目前对咱们经管专业最有用可能是

  • NRC-Colour-Lexicon-v0.92

  • NRC-Emotion-Lexicon-v0.92

我们可以使用上面两个词典度量文本的情绪信息,也可以分析文本的色彩信息。

词语的色彩

色彩是成功传递信息的重要组成部分,无论是在销售商业产品(Sable和Akcay,2010),设计网页(Meier,1988;Pribadi等,1990)还是可视化信息(Christ,1975)中 ;Card等,1999)。由于实际概念与某些颜色类别(例如,红色危险和粉红色柔和度)相关联,因此使用适当的颜色来补充语言和非语言信息会带来很多好处,包括:

  • 加强讯息(改善语义连贯性)

  • 减轻接收者的认知负担

  • 快速传达信息

  • 唤起所需的情绪反应

例如考虑在停车标志中使用红色,驾驶员能够更快地识别该标志,并且会引起与危险有关的潜意识情绪,同样,使用红色标注高犯罪率的区域是很好地使用颜色的例子。另一方面,不恰当的使用颜色可能更有害于理解(Marcus,1982;Meier,1988)。

大多数语言中许多表达情感的词语都有涉及色彩的表达, 在英语中的例子包括:

  • 嫉妒的绿色

  • 贵族的蓝色血统

  • 牧场的绿色(更好的大道)

  • 黄腹(怯co的)

  • 红地毯(特殊处理)

  • 透过玫瑰色眼镜看(乐观)。

此外,不断出现新的表达方式,例如灰色和比安卡·马斯登(Bianca Marsden)的诗《混乱》中的不确定性。因此,概念-颜色关联的知识 对于自动自然语言系统(例如,文本含义,释义,机器翻译和情感分析)也可能有用。

当颜色是单词所指概念的显着特征时,或者因为该单词与此类概念相关,则单词与颜色具有很强的关联性。许多概念-颜色关联,例如天鹅与白色和蔬菜与绿色,都涉及物理实体。但是,即使是抽象的概念和情感也可能具有与社会相关的色彩(诚实–白色,危险–红色,喜悦–黄色,愤怒–红色)。此外,许多协会是特定于文化的(Gage,1969;Chen,2005)。例如,在亚洲大部分地区,繁荣与红色有关。

不幸的是,没有一个词库能够捕获概念-颜色的关联,并且仍然存在许多问题,例如人类对这些关联的共识程度以及物理概念是否更可能具有颜色关联比抽象的我们期望单词-颜色关联在文本和语音中表现为共现,但是还没有研究表明单词在多大程度上与关联的颜色共存,而不是与其他颜色共存。

研究发现:

  • 超过30%的术语具有强烈的颜色关联(第4节)

  • 约33%的词库类别具有很强的颜色关联(第5节)。

  • 抽象术语几乎与物理实体一样具有颜色关联(第6节)。

  • 情绪和极性与颜色有很强的联系(第7节)。

  • 词色关联在WordNet中表现为紧密(程度较小),在文本中表现为较高的同时出现率(程度较大)(第8节)。

色彩词典截图

词语颜色词典目前只有英文版,截图如下

情绪词典

情绪通常通过不同的面部表情来表达(亚里士多德,1913;拉塞尔,1994)。不同的情感也通过不同的语言表达。例如

  • 愉悦和好吃表明喜悦的情绪

  • 忧郁和哭泣表明悲伤

  • 呼喊和沸腾表明愤怒

  • 等等

本情绪词典支持包括英语、法语、阿拉伯语、中文和西班牙语等在内的105种语言。

情绪词典截图

情绪词典是基于英文数据,但扩展为105种语言。如下图,excel有105列+9列,其中前105列是同一个意思在105种语言但不同表达。

后9列是积极、消极及7种情绪(喜怒哀乐愁怨恨)

http://sentiment.nrc.ca/lexicons-for-research/ [1]Saif, Mohammad. "Colourful Language: Measuring Word-Colour Associations, 2011a." In Proceedings of the ACL 2011 Workshop on Cognitive Modeling and Computational Linguistics (CMCL). 2011. [2]Mohammad, Saif M., and Peter D. Turney. "Crowdsourcing a word–emotion association lexicon." Computational Intelligence 29, no. 3 (2013): 436-465.

近期文章

精选课程 | Python文本数据分析实战(学术)

Python爬虫与Stata应用能力提升与实证前沿  寒假工作坊

使用Python读取图片中的文本数据

Loughran&McDonald金融文本情感分析库

股评师分析报告文本情感分析预测股价

如何使用seaborn绘制组合图

代码不到40行的超燃动态排序图

使用Python自动生成事件分析图谱

使用分析师报告中含有的情感信息预测上市公司股价变动

日期数据操作第1期 datetime库

日期数据操作第2期 pandas库

史上最大规模1.4亿中文知识图谱开源下载

【公开视频课】Python语法快速入门

【公开视频课】Python爬虫快速入门

文本数据分析文章汇总(2016-至今)

当文本分析遇到乱码(ง'⌣')ง怎么办?

当pandas遇上数据类型问题

如何理解pandas中的transform函数

一行pandas代码生成哑变量

Python最被低估的库,用好了效率提升10倍!

情绪及色彩词典获取方式,请在公众号后台回复关键词“20191216” ,

如果想做文本分析

可购买网课 | Python文本数据分析实战(学术)

或参加Python&Stata数据采集与数据分析实证前沿寒假工作坊 

NRC词语情绪词典和词语色彩词典相关推荐

  1. python 多分类情感词典_基于情感词典的文本情感分类

    基于情感词典的文本情感分类 传统的基于情感词典的文本情感分类,是对人的记忆和判断思维的最简单的模拟,如上图.我们首先通过学习来记忆一些基本词汇,如否定词语有"不",积极词语有&qu ...

  2. python制作词典软件_AlphaDict: 它是一个轻量级的开放词典格式的开源词典软件,你可以制作自己的词典, 也是一个跨平台的软件支持 linux, unix and windows....

    关于 "阿尔法词典" =============== 版本号: 1.4.1 作者: 李力琼 (joni lee) 网站: prajna.top 它是一个轻量级的开放词典格式的开源 ...

  3. python自己做电子词典_python实现电子词典

    本文实例为大家分享了python实现电子词典的具体代码,供大家参考,具体内容如下 服务端 #!/usr/bin/env python3 from __future__ import unicode_l ...

  4. python制作词典_我的词典我做主!python3.5生成自己的词性词典

    由于朋友需要做文本分析,前提是要将文本中的名词和动词剔除掉,但没有现成的名词和动词的txt格式的词典.于是找来了一个英汉词典,根据每一行出现的adj.adv.n.prep等,使用正则表达式匹配需要的词 ...

  5. python 改变词典顺序_按词典顺序排列的功率集

    python 改变词典顺序 Description: 描述: This is a standard interview problem to find out the power sets in le ...

  6. 和电商有关的词语_电商描写的词语 形容“电”的词语有哪些?

    形容"电"的词语有哪些 1 风驰电掣 fēng chí diàn chè 形容非常迅速,像风吹闪电一样快. 2 风驰电骋 fēng chí diàn chěng 形容像刮风和闪电那 ...

  7. php为首字母的词语,PHP提取中英文词语及数字首字母的简单示例

    这篇文章主要为大家详细介绍了PHP提取中英文词语及数字首字母的简单示例,具有一定的参考价值,可以用来参考一下. 感兴趣的小伙伴,下面一起跟随512笔记的小玲来看看吧! 最近项目有个需求,在一个中英文( ...

  8. NLP︱句子级、词语级以及句子-词语之间相似性(相关名称:文档特征、词特征、词权重)

    每每以为攀得众山小,可.每每又切实来到起点,大牛们,缓缓脚步来俺笔记葩分享一下吧,please~ --------------------------- 关于相似性以及文档特征.词特征有太多种说法.弄 ...

  9. 安卓开发仿有道词典和谷歌翻译词典软件在线输入翻译源码下载

    可用android studio直接打开,仿有道词典.谷歌翻译软件制作,在线翻译,提供源码下载! @Overrideprotected void onCreate(Bundle savedInstan ...

最新文章

  1. Ctex软件介绍安装破解(是WinEdt_v6.0破解)
  2. SpringCloud接入EDAS——服务发现篇
  3. python 网页登录selenium_使用selenium登录网页
  4. Sharepoint 2007 用代码聚合所有子网站文章 (populating data sources in code)
  5. doubleClick-v2-as3.0 学习笔记(2)--Video相关
  6. 计算机网络-基本概念(4)【网络层】-IPv4向IPv6过渡
  7. Sysnoise5.6安装教程
  8. 封包时发现的关于QIODevice类write函数的坑
  9. 关于Actionscript 3中给Flash传参数方法(一)
  10. python函数式编程读取数据时出现错误_Python编程中,函数遇到问题是抛出错误好还是约定返回值好?...
  11. 在FPGA上完美复刻Windows 95
  12. 实对称矩阵的特征向量矩阵为酉矩阵
  13. CAD 部分快捷键注释
  14. MySQL学习第三弹——约束与多表查询详解
  15. G1的基本概念(G1源码分析和调优读书笔记)
  16. 批量发送邮件(java开发、带图片和附件)
  17. 原来等待我做的事情还有很多
  18. mysql on.000002_mysql | 同乐学堂
  19. android studio 根目录,AS 根目录结构说明
  20. 记录从指尖悄悄流逝的时间

热门文章

  1. 【机器学习】当贝叶斯、奥卡姆和香农一起来定义机器学习时
  2. CSS3圆角边框的使用-遁地龙卷风
  3. lable标签的宽度_html中的label标签怎么设置高度?label标签的使用方法介绍
  4. 蚂蚁开放平台开发第三方授权登陆(二):PC端
  5. 上海宝山锦隆考试基地科目三笔记
  6. 怎么将html发布到天猫,天猫商家商品发布到淘小铺后台流程
  7. eclipse c++安装
  8. React 高阶组件(HOC)
  9. echart图片库_附录:ECharts图属性介绍-统计图
  10. 中国民营企业的8+10种死法