人群与网络:万维网结构、链接分析与网络搜索
前置:关于有向图和强联通分量
万维网结构:领结图
对于一张有向图,求出对应领结图步骤如下:
①已知一个一定在scc中的点,如上图的点1
②求出从1出发能到达的所有点的集合FS = {1,3,4,5,8,9,10,13,14,15,16,18}
③求出反向图中,从1出发能到达的所有点的集合BS = {1,3,4,6,7,8,9,11,12,13,14,15,18}
④得出SCC = FS∩BS = {1,3,4,8,9,13,14,15,18};IN = BS-SCC = {6,7,11,12};OUT = FS-SCC = {5,10,16}
领结图如下:
网页的“中枢”与“权威”性:
被很多网页指向 → 权威性高,认可性强
指向很多网页 → 中枢性强
HITS算法:计算网页的权威值(auth)和中枢值(hub)
①对于一个有向图,初始化所有节点auth[] = hub[] = 1
②利用中枢值更新权威值 → 对于每一个节点p,auth[p] = 指向p的所有点hub[]值之和
③利用权威值更新中枢值 → 对于每一个节点p,hub[p] = p指向的所有点auth[]值之和
④重复步骤②③若干次,且步骤②③可以进行归一化:值/总和(归一化随迭代次数趋向一个极限)
PageRank基本算法:节点重要性测度
基本要领:每一个节点将自己的值均分给出向邻居
初始化a = b = c = d = 1,迭代70次之后收敛到a = 0.615,b = 0.923,c = d = 0.231(和不变)
①在一个由“引用”或者“推荐”关系构成的信息网络中,每个节点的重要性可以认为取决于有多少人推荐,以及推荐人的重要性。②这种重要性可以通过“PageRank算法”得到量化。③PageRank算法的基本精神是基于信息网络的结构,让每个节点不断把自己的重要性非给出向邻居,同时用从入向邻居收到的重要性之和来更新自己。④例如要测量社交网络中一个人的影响力和可信度,可以用PageRank算法来计算
PageRank算法缺陷与改进
如下图,迭代无数次后除了F和G为0.5外,其它点都为0
改进方法→①同比缩减:在每次运行基本Pagerank更新规则后,将每一节点的PR值都乘以一个小于1的比例因子s,0<s<1,经验值在0.8-0.9之间;②统一补偿:在每一节点的PR值上统一加上(1-s)/n,这样,既维持了所有PR值和为1的性质,也防止PR值过度集中到某个节点上
随机游走问题:一个人从一篇随机选择的网页开始,然后随机选择其中的一个链接浏览到下一篇网页,并不断的如此进行,称为“随机游走”,考虑任何一个网页X,问经过k步随机游走到X的概率是多少
可以证明:到达X的概率等于运行PageRank基本算法k步得到的值
人群与网络:万维网结构、链接分析与网络搜索相关推荐
- 一个完整的网络访问过程的分析(从计算机网络的角度)
首先,我们要明确上网需要的四个参数(本机),分别是: 1.本机的ip地址 2.子网掩码 3.网关的ip地址 4.DNS的ip地址 这里,我以自己的电脑为例(我的电脑用的是配置ip,当然大多数用的都是动 ...
- 虹科分享 | IOTA网络性能监控 | 如何有效分析VoIP问题
通过IP协议传输语音在企业网络和提供商环境中都带来了各种挑战.首先,存在非常高的可用性要求.但是,作为实时服务,用户也会立即注意到服务质量上的问题.特别是数据包丢失.抖动和延迟等网络质量参数对最终的语 ...
- 网络组合攻击建模分析
网络组合攻击建模分析(网络中可能存在攻击进行分析) 这里是引用"网络组合攻击建模方法研究进展 " 毛捍东 陈 锋 张维明 朱 承 计算机科学 ZOO 7 Vol.34 N0.11 ...
- 基于A股供应链网络的股票收益分析
量化投资与机器学习微信公众号,是业内垂直于量化投资.对冲基金.Fintech.人工智能.大数据等领域的主流自媒体.公众号拥有来自公募.私募.券商.期货.银行.保险.高校等行业30W+关注者,曾荣获AM ...
- IOT-OS之RT-Thread(十三)--- 网络分层结构 + netdev/SAL原理
文章目录 一.网络分层结构 二.RT-Thread网络分层结构 2.1 ENC28J60设备驱动层 2.2 设备无关接口层netdev 2.3 网络协议层LwIP 2.4 协议无关接口层SAL 2.5 ...
- 【转】网络即时战略游戏软件开发 结构体系分析
文档下载地址:http://download.csdn.net/detail/wanggan768q/4388056 网络即时战略游戏软件开发 结构体系分析 前言 本人对网络游戏的技术问题一直比较 ...
- 网络即时战略游戏软件开发 结构体系分析
文档下载地址:http://download.csdn.net/detail/wanggan768q/4388056 网络即时战略游戏软件开发 结构体系分析 前言 本人对网络游戏的技术问题一直比较 ...
- 链接分析算法在网络舆情热点
基于PageRank算法的热点舆情挖掘 原理:PageRank算法原理 在舆情热点挖掘中引入 PageRank算法思想,构造舆情网络,单个节点的重要性来 自于该网络中其 他成员节点重要性的线性组合,从 ...
- 如何使用netwokx进行复杂网络的中心性分析?
如何使用netwokx进行复杂网络的中心性分析? 这是本学期在大数据哲学与社会科学实验室做的第七次分享了. 第一次分享的是: 如何利用"wordcloud+jieba"制作中文词云 ...
最新文章
- java 媒体播放器_Java多媒体播放器(三)
- SilhoNet:一种用于3D对象位姿估计和抓取规划的RGB方法
- jQuery 性能优化技巧
- re.findall 两个连续匹配成功的输出后一个
- SonarQube代码质量管理平台安装与配置
- IDEA中无法识别servlet类或找不到javax.servlet.*
- windows下安装配置mongodb
- 如何open一个新tab页面
- 瓜子二手车在 Dubbo 版本升级、多机房方案方面的思考和实践
- ASP.Net学习笔记011--ASP.Net揭秘之div版本自增
- 用sqoop将mysql的数据导入到hive表
- cpu使用率偏高如何排查
- 谷歌浏览器文字转语音
- 未认证小程序关联已认证公众号,复用公众号资质快速进行认证
- 把JRuby Rails应用部署在Java应用服务器上
- Excel的Index函数详解
- 无约束优化:线搜索最速下降
- 强大且免费的文本转换工具,word转其他格式,epub转换
- 哈夫曼编码树的经典题目
- python全套数据分析课程_B 站疯传,堪称最强,一整套Python数据分析课程,学完月薪30K+!...
热门文章
- php和python-php与python谁更适合web开发?为什么?
- 零基础自学python-零基础如何自学成为Python高手?
- python骗局-说真的!大家做Python一定不要只会一个方向
- 离线语音识别_离线语音识别库_离线语音识别sdk - 云+社区 - 腾讯云
- 语音识别芯片原理是什么 语音识别芯片有哪些【详解】
- outlook搜索栏跑到上面去了_Outlook邮箱批量下载邮件附件+快速复制文件名
- sql 获取当前整点时间,当前时间减去12小时
- window10设置文件夹备注
- MediaMuxer的使用
- vscode中文_VS Code 中文社区正式成立啦!VS Code Day 圆满落幕!