基于PageRank算法的热点舆情挖掘

原理:PageRank算法原理

在舆情热点挖掘中引入 PageRank算法思想,构造舆情网络,单个节点的重要性来 自于该网络中其 他成员节点重要性的线性组合,从而建构一个线性方程组, 舆情网络 中各节点的重要性即该线性方程组最大特征值所对应的特征矢量。

以下算法可以用来描述舆情络 的热点挖掘过程 :

(1)取 n个直接或间接链接关系的页面构建舆情网络,每个页面为该网络的节点 ;

(2)建立该舆情网络的邻接矩阵A,其中aij=1表示节点 i与节点j之间存在直接连接;aij=0表示节点i与节点j之间不存在直接连接 ; λ 表示矩阵A的主特征值,主特征值 λ 的特征向量用 e表示 , 即e= (e1,e2,⋯,en );

(3)定义 Xλ =AX , 有 :

 使用公式( 3) 计算舆情网络节点的特征向量值, 降序后输出, 得到舆情热点。

应用实例:

以上图所示的简单舆情网络中标注的A、 B、 c、 D这4个节点为例,使用PageRank方法, 通过计算 4个节点的特征 向量挖掘舆论热点。节点 A处于该舆情网络中心位置,通过 计算得知其特征向量值为1.2,说明了 A节点的核心地位;网络节点 B的特征向量值为1.14,位居其 次;网络节点 C的特征向量值为1.01;网络节点 D的特征向量值为 0.71, 其重要性即热度相对最低。

基于Hits算法的热点舆情挖掘

原理:Hits算法原理

在舆情热点挖掘中引入Hits算法基本思想,将网页内容核心度映射为舆情网络中节点核心度,用c表示;对网页内容核心的附属关系则映射为舆情网络中节点的趋近核心度,用n表示.以下算法可以用来描述舆情网络的热点挖掘过程:

(1)用页面和链接关系建立舆情网络,构造算法的初始集合s,s中的元素为舆情网络的任意个节点p,节点数m=200;

(2)构造舆情链接关系集合T:s∪(与m链接的节点集)∪(引用m的内节点集);

(3)计算s中所有舆情节点P的核心度值Pc和趋近核心度值Pn,分别用式(1)和(2)表示

其中:各舆情节点的核心度值c和趋近核心度值n均初始化为1;

(4)对步骤3进行迭代,直至Pc与Pn趋于稳定;

(5)将计算所得舆情节点的核心度值Pc进行降序排列后输出,得到舆情热点.

参考:《网络舆情热点挖掘算法研究与实现》黄敏

链接分析算法在网络舆情热点相关推荐

  1. FP-Growth关联分析算法在网络监控领域的应用

    关联分析算法在网络监控领域的应用: 在现今网络规模大,涉及专业多,告警总数大的现在,迫切需要提高对海量告警的分析能力,实现对告警数据的挖掘,提高对有价值告警的提取,简化监控人员的工作,提高排障效率.常 ...

  2. 链接分析算法系列-机器学习排序

    这个系列的文章:原文 一:链接分析算法之:HITS算法: HITS(HITS(Hyperlink - Induced Topic Search) ) 算法是由康奈尔大学( Cornell Univer ...

  3. 链接分析算法PageRank和HITS

    链接分析算法PageRank和HITS PageRank PageRank是Google创始人提出的链接分析算法计算模型,可以说成就了Google公司. PageRank考察网页时,不仅考虑到入链数量 ...

  4. 网络舆情热点发现及分析(single-pass聚类)

    热点话题的发现模型 在整个的过程中,介绍三个点: 预处理:基于网络新词的识别算法 热点话题发现:增量聚类算法Single-Pass 热点话题分析:文本倾向性分析 基于网络新词的识别算法 算法思路: 首 ...

  5. 基于kmeans聚类算法的微博舆情热点事件分析系统

    目录 第一章 引言 2 1.1 研究背景及意义 2 1.2 国内外相关问题研究现状 3 1.3 论文的理论意义与实用价值 4 第二章 相关技术介绍 4 2.1 开发平台简述 4 2.2 OAuth2. ...

  6. 大数据毕设选题 - 大数据网络舆情热点数据分析系统(情感分析 python)

    文章目录 0 前言 1 课题背景 2 实现效果 3 文本情感分析 3 Django 4 爬虫 5 最后 0 前言

  7. 网络舆情分析系统的研究与设计

    Quanlong Guan1, Saizhi Ye2, Guoxiang Yao2, Huanming Zhang1, Linfeng Wei2, Gazi Song2, Kejing He3 1中国 ...

  8. 文本挖掘在网络舆情信息分析中的应用_笔记

    文本挖掘在网络舆情信息分析中的应用 一.网络舆情信息的作用: 1.桥梁作用:有助于了解情况.掌握社情民意 2.耳目作用:有助于全面系统而又简明扼要的掌握某一种时期或与某一专题有关的社会舆情状况 3.决 ...

  9. 2021年二季度重大舆情热点盘点分析

    本报告特对2021年第二季度(4.1-6.30)具有代表性的网络舆情热点和事件进行了分析和汇总,希望可以助力于大家了解二季度网络舆情热点事件和展开二季度舆情分析工作. 2021年第二季度网络舆情事件分 ...

最新文章

  1. linux服务器打包命令,linux 打包命令tar(主要用于服务器之间迁移资源文件)
  2. Oracle锁与数据库性能
  3. VB.NET 调用外部程序
  4. urllib,urllib2和request模拟登陆人人网比对
  5. 多系统权限设计(一)
  6. angularjs中state的参数4_mpvue中使用Vuex
  7. 2017 数据驱动大会豪华议程出炉,早鸟票一周内全部售罄
  8. JZOJ 3885. 【长郡NOIP2014模拟10.22】搞笑的代码
  9. Mybatis Plus——以XML方式使用 Wrapper 自定义SQL时IDEA错误[**expected, got ‘${‘]解决方案
  10. vue2.0+stylus实现星级评定组件,computed计算属性实现全星半星,动态改变星级,多种星星规格
  11. zhihu 知乎社区里点击了Ctrl + C组合键的技术实现
  12. wrapper包装java_java Object 类 与 Wrapper包装类
  13. 抽取JDBC工具类:JDBCUtils
  14. leetcode container-with-most-water(medium) /java
  15. C#如何卸载已安装的Windows Service服务
  16. 便携计算机硬盘,科技:适用于Mac或PC的最佳便携式外置硬盘
  17. 【Unity3D】Android 打包 ① ( Android 编译选项 | 安装 Android Build Support 模块 )
  18. 方正浩:智能制造和工业互联网的投资新视角
  19. 手机IO workload解析
  20. html 淡出淡入轮播图,用CSS3 transition属性实现淡入淡出轮播图

热门文章

  1. 非欧几何三角形内角和大于或者小于180°
  2. linux定时器crontab的使用
  3. 化学中的机器学习方法1
  4. 更少标注的机器学习方法——主动学习(python示例)
  5. 关于幂级数求导/积分后幂级数收敛域变化的问题
  6. 《管理学》第五章 组织(MOOC+思维导图)
  7. 读书笔记:组织文化10个特点
  8. “低声教育”,才是给孩子最好的礼物
  9. JAVA ffmpeg 视频处理
  10. 百度通用翻译api在微信小程序中的使用