今天开始我们来讨论下微博情感分析的具体方法。我会以不同的方法作为章节来概述微博情感分析的过程。

情感分析及评价对象抽取,目前主要有两种基本方法。一种是基于句型、句法、语义的词典及规则方法,一种是基于标注语料的机器学习方法。我认为,情感分析,分析的是语言的意义,要想在对语言进行深层理解的基础上完成情感分析,可能自学习的方法更有优势。但目前尚无无监督的分类方法,所以相比人工标注语料的机器学习方法,规则的方法可能更有优势。建立规则需要一定的统计方法,但统计只在建立词典确立词条属性、建立规则库确定规则优先级时发挥作用。针对话题型微博,情感词典主要采用词典词性计算的方法得到句子的情感值。但根据我前文所说,其实可以将情感词在词性上再做分层,虽然我们很难得到一个情感词的具体情感值,但我们可以扩大范围以获取情感词所在的词性区间。通过计算区间均值可以近似计算句子的情感值。词性计算的时候,可以加大情感因子颗粒度,之后结合构建基于短语的情感词典,通过短语规则确定句子极性。

(1)构建基于短语的情感词典

识别观点句,学界的通常做法是以情感词作为依据,带有情感词的是观点句,否则就是非观点句。也有一些学者注意到了短语在情感分析中的作用。话题型微博中的观点句由于情感表达强烈而理性评价淡化,各种脏话、粗话、口语词语大量使用,加之很多非直接性的表达,使得影响句子的情感因子的颗粒度加大,仅仅依靠传统的情感词典,依靠句子中是否有情感词来进行观点句的判断,会造成很多错判,因此在基本情感词典的基础上,可以用人工方式增加了情感短语,构建基于短语的情感词典。

情感短语词典突破了以词为主要收录对象的局限,将明确表达观点的情感短语甚至短句都收录其中,如“不得好死、不咋的、扯犊子、就好了、瞎折腾个屁、不是找抽吗、什么玩意儿、没一个好东西、好不到哪儿去、以为自己是谁啊、可以说脏话吗、这是人的行为吗、良心让狗吃了”等等。当然,一些明确表达观点的口语词、网络用语和脏话也必须收录到情感词典中,如“得瑟、傻逼、狗逼、操蛋、犯贱、傻B、欠揍、找死”等,这样包含这些情感短语和情感词的观点句就能够被准确地识别出来,从而可以在不降低准确率的前提下,提高系统对观点句的召回率。

(2)通过短语规则确定观点句及其极性

话题型微博语言简单,短句多,长句少;单句多,复句少。针对这种特点,在建立短语情感词词典的同时,可以建立短语规则库,试图解决情感短语词

实体词典 情感词典_情感词典相关推荐

  1. 电子词典系统vc++_电子词典代码(c语言)

    [实例简介] 个人写的一个电子词典,可以增删改查,页面用鼠标进行 [实例截图] [核心代码] 29994824电子词典 └── 电子词典 └── DictionaryBook ├── Debug │  ...

  2. 电子词典系统vc++_电子词典系统

    1 C 语言程序课程设计任务书 一 课程设计性质与目的: C 语言程序设计是一门实践性很强的课程. C 程序课程设计是学习 C 语言 程序设计的非常重要的实践环节,通过本课程设计使学生进一步巩固课堂所 ...

  3. 实体词典 情感词典_基于词典的文本情感分析(附代码)

    一.引言 目前中文文本情感分析主要分为三个类型,第一个是由情感词典和句法结构来做的.第二个是根据机器学习来做的(Bayes.SVM等).第三个是用深度学习的方法来做的(例如LSTM.CNN.LSTM+ ...

  4. python情感词典计算得分_基于情感词典的情感打分

    原理我就不讲了,请移步下面这篇论文,包括情感词典的构建(各位读者可以根据自己的需求稍作简化),以及打分策略(程序对原论文稍有改动). 论文在这里下载:基于情感词典的中文微博情感倾向性研究 (大家可以上 ...

  5. 电子英汉词典c语言程序设计报告,英汉电子词典设计报告_设计_C语言_C语言程序设计.doc...

    英汉电子词典设计报告_设计_C语言_C语言程序设计 课程设计 课程名称 :C语言程序课程设计 题目名称 :电子英汉词典 学生学院 :电气信息学院 专业班级 :自动化1101 学 号 :20110102 ...

  6. 深度学习 情感分析_使用深度学习进行情感分析

    深度学习 情感分析 介绍 (Introduction) The growth of the internet due to social networks such as Facebook, Twit ...

  7. jieba分词三种分词模式、用户自定义词典、停用词词典的使用

    目录 三种分词模式 自定义词典使用 停用词词典的使用 补充知识 1.中文语料库: 2.中文分词技术 2.1 规则分词 2.2 统计分词 三种分词模式 精确模式:试图将句子最精确地切分开,适合文本分析. ...

  8. mysql 语义分析_情感和语义分析最全中文数据库

    [实例简介] 最全的中文情感和语义词典,文件内容(TXT和excel)如下: 1. 褒贬词及其近义词: 2. 汉语情感词极值表: 3. 清华大学李军中文褒贬义词典: 4. 情感词典及其分类: 5. 情 ...

  9. java对微博评论进行分析_微博上分析情感的_中文情感分析java_中文微博情感分析...

    目前,社会正处于一个微博崛起的时代,一切有关于微博的问题都被社会广泛关注,并得到了工业界和学术界的高度重视.微博从出现以来,取得了良好的发展,并拥有大众的普遍关注和应用.微博的超大信息量和高速度的更新 ...

  10. python实现情感分析_利用python实现简单情感分析

    最近选修的大数据挖掘课上需要做关于情感分析的pre,自己也做了一些准备工作,就像把准备的内容稍微整理一下写出来,下次再做类似项目的时候也有个参考. 情感分析是什么? 文本情感分析是指用自然语言处理(N ...

最新文章

  1. 在列表显示某个内容,但数据表没有这个字段
  2. python输出数据格式_这串数据有什么方法用python输出我想要的格式?
  3. 标识位:可以用以确定鼠标点击的是哪一个按钮或者是文本框
  4. IE6中png背景图片透明的最好处理方法
  5. 10 款基于 jQuery 的切换效果插件推荐
  6. linux superblock 时间,Linux命令(八)
  7. MySQL主从复制作用和原理
  8. android cpu负载 工具,计算Android中进程的CPU使用率
  9. Pandas Index对象
  10. 唐诗辑注 —— 辛夷坞、南园十三首、问六十九
  11. conn (php)
  12. Python 读取/存储 yaml 文件
  13. Ubuntu9.04升级到9.10后的问题及其解决方法
  14. 五月天歌曲下载【专辑整理版】
  15. 创业一年半项目经验分享
  16. 微信小游戏上线字节平台超全攻略
  17. 仿微信发朋友圈获取定位
  18. java开源saas项目
  19. 华为发布首款鸿蒙系统终端,首款鸿蒙系统终端新闻 华为正式发布鸿蒙系统
  20. 2022,程序员应该如何找工作

热门文章

  1. python photoshop自动化_你会用Python 搞定你的电子签名吗?
  2. java子弹集合_Java使用线程并发库模拟弹夹装弹以及发射子弹的过程
  3. python面向对象基础知识_面向对象的一些基本知识(python)
  4. 洪雅中学成绩2021高考查询,洪雅中学2021年排名
  5. 【转载】Linux GCC常用命令
  6. win7 32位机安装VMware win7 64位虚拟机
  7. leetcode[81]Search in Rotated Sorted Array II
  8. VS2008 母版页嵌套母版页,下级母版页不执行Page_Load解决方法
  9. sqlserver中的函数
  10. 关闭Windows自动更新—大法