实体词典 情感词典_情感词典
今天开始我们来讨论下微博情感分析的具体方法。我会以不同的方法作为章节来概述微博情感分析的过程。
情感分析及评价对象抽取,目前主要有两种基本方法。一种是基于句型、句法、语义的词典及规则方法,一种是基于标注语料的机器学习方法。我认为,情感分析,分析的是语言的意义,要想在对语言进行深层理解的基础上完成情感分析,可能自学习的方法更有优势。但目前尚无无监督的分类方法,所以相比人工标注语料的机器学习方法,规则的方法可能更有优势。建立规则需要一定的统计方法,但统计只在建立词典确立词条属性、建立规则库确定规则优先级时发挥作用。针对话题型微博,情感词典主要采用词典词性计算的方法得到句子的情感值。但根据我前文所说,其实可以将情感词在词性上再做分层,虽然我们很难得到一个情感词的具体情感值,但我们可以扩大范围以获取情感词所在的词性区间。通过计算区间均值可以近似计算句子的情感值。词性计算的时候,可以加大情感因子颗粒度,之后结合构建基于短语的情感词典,通过短语规则确定句子极性。
(1)构建基于短语的情感词典
识别观点句,学界的通常做法是以情感词作为依据,带有情感词的是观点句,否则就是非观点句。也有一些学者注意到了短语在情感分析中的作用。话题型微博中的观点句由于情感表达强烈而理性评价淡化,各种脏话、粗话、口语词语大量使用,加之很多非直接性的表达,使得影响句子的情感因子的颗粒度加大,仅仅依靠传统的情感词典,依靠句子中是否有情感词来进行观点句的判断,会造成很多错判,因此在基本情感词典的基础上,可以用人工方式增加了情感短语,构建基于短语的情感词典。
情感短语词典突破了以词为主要收录对象的局限,将明确表达观点的情感短语甚至短句都收录其中,如“不得好死、不咋的、扯犊子、就好了、瞎折腾个屁、不是找抽吗、什么玩意儿、没一个好东西、好不到哪儿去、以为自己是谁啊、可以说脏话吗、这是人的行为吗、良心让狗吃了”等等。当然,一些明确表达观点的口语词、网络用语和脏话也必须收录到情感词典中,如“得瑟、傻逼、狗逼、操蛋、犯贱、傻B、欠揍、找死”等,这样包含这些情感短语和情感词的观点句就能够被准确地识别出来,从而可以在不降低准确率的前提下,提高系统对观点句的召回率。
(2)通过短语规则确定观点句及其极性
话题型微博语言简单,短句多,长句少;单句多,复句少。针对这种特点,在建立短语情感词词典的同时,可以建立短语规则库,试图解决情感短语词
实体词典 情感词典_情感词典相关推荐
- 电子词典系统vc++_电子词典代码(c语言)
[实例简介] 个人写的一个电子词典,可以增删改查,页面用鼠标进行 [实例截图] [核心代码] 29994824电子词典 └── 电子词典 └── DictionaryBook ├── Debug │ ...
- 电子词典系统vc++_电子词典系统
1 C 语言程序课程设计任务书 一 课程设计性质与目的: C 语言程序设计是一门实践性很强的课程. C 程序课程设计是学习 C 语言 程序设计的非常重要的实践环节,通过本课程设计使学生进一步巩固课堂所 ...
- 实体词典 情感词典_基于词典的文本情感分析(附代码)
一.引言 目前中文文本情感分析主要分为三个类型,第一个是由情感词典和句法结构来做的.第二个是根据机器学习来做的(Bayes.SVM等).第三个是用深度学习的方法来做的(例如LSTM.CNN.LSTM+ ...
- python情感词典计算得分_基于情感词典的情感打分
原理我就不讲了,请移步下面这篇论文,包括情感词典的构建(各位读者可以根据自己的需求稍作简化),以及打分策略(程序对原论文稍有改动). 论文在这里下载:基于情感词典的中文微博情感倾向性研究 (大家可以上 ...
- 电子英汉词典c语言程序设计报告,英汉电子词典设计报告_设计_C语言_C语言程序设计.doc...
英汉电子词典设计报告_设计_C语言_C语言程序设计 课程设计 课程名称 :C语言程序课程设计 题目名称 :电子英汉词典 学生学院 :电气信息学院 专业班级 :自动化1101 学 号 :20110102 ...
- 深度学习 情感分析_使用深度学习进行情感分析
深度学习 情感分析 介绍 (Introduction) The growth of the internet due to social networks such as Facebook, Twit ...
- jieba分词三种分词模式、用户自定义词典、停用词词典的使用
目录 三种分词模式 自定义词典使用 停用词词典的使用 补充知识 1.中文语料库: 2.中文分词技术 2.1 规则分词 2.2 统计分词 三种分词模式 精确模式:试图将句子最精确地切分开,适合文本分析. ...
- mysql 语义分析_情感和语义分析最全中文数据库
[实例简介] 最全的中文情感和语义词典,文件内容(TXT和excel)如下: 1. 褒贬词及其近义词: 2. 汉语情感词极值表: 3. 清华大学李军中文褒贬义词典: 4. 情感词典及其分类: 5. 情 ...
- java对微博评论进行分析_微博上分析情感的_中文情感分析java_中文微博情感分析...
目前,社会正处于一个微博崛起的时代,一切有关于微博的问题都被社会广泛关注,并得到了工业界和学术界的高度重视.微博从出现以来,取得了良好的发展,并拥有大众的普遍关注和应用.微博的超大信息量和高速度的更新 ...
- python实现情感分析_利用python实现简单情感分析
最近选修的大数据挖掘课上需要做关于情感分析的pre,自己也做了一些准备工作,就像把准备的内容稍微整理一下写出来,下次再做类似项目的时候也有个参考. 情感分析是什么? 文本情感分析是指用自然语言处理(N ...
最新文章
- 在列表显示某个内容,但数据表没有这个字段
- python输出数据格式_这串数据有什么方法用python输出我想要的格式?
- 标识位:可以用以确定鼠标点击的是哪一个按钮或者是文本框
- IE6中png背景图片透明的最好处理方法
- 10 款基于 jQuery 的切换效果插件推荐
- linux superblock 时间,Linux命令(八)
- MySQL主从复制作用和原理
- android cpu负载 工具,计算Android中进程的CPU使用率
- Pandas Index对象
- 唐诗辑注 —— 辛夷坞、南园十三首、问六十九
- conn (php)
- Python 读取/存储 yaml 文件
- Ubuntu9.04升级到9.10后的问题及其解决方法
- 五月天歌曲下载【专辑整理版】
- 创业一年半项目经验分享
- 微信小游戏上线字节平台超全攻略
- 仿微信发朋友圈获取定位
- java开源saas项目
- 华为发布首款鸿蒙系统终端,首款鸿蒙系统终端新闻 华为正式发布鸿蒙系统
- 2022,程序员应该如何找工作
热门文章
- python photoshop自动化_你会用Python 搞定你的电子签名吗?
- java子弹集合_Java使用线程并发库模拟弹夹装弹以及发射子弹的过程
- python面向对象基础知识_面向对象的一些基本知识(python)
- 洪雅中学成绩2021高考查询,洪雅中学2021年排名
- 【转载】Linux GCC常用命令
- win7 32位机安装VMware win7 64位虚拟机
- leetcode[81]Search in Rotated Sorted Array II
- VS2008 母版页嵌套母版页,下级母版页不执行Page_Load解决方法
- sqlserver中的函数
- 关闭Windows自动更新—大法