《这就是搜索引擎:核心技术详解》第6章链接分析,本章主要介绍一些著名的链接分析方法。本节为大家介绍随机游走模型(Random Surfer Model)。

互联网用户在上网时,往往有类似的网络行为:输入网址,浏览页面,然后顺着页面的链接不断打开新的网页。随机游走模型就是针对浏览网页的用户行为建立的抽象概念模型。之所以要建立这个抽象概念模型,是因为包括PageRank 算法在内的很多链接分析算法都是建立在随机游走模型基础上的。

图6-4 给出了随机游走模型的示意图。在最初阶段,用户打开浏览器浏览第1 个网页,假设我们有一个虚拟时钟用来计时,此时可以设定时间为1,用户在看完网页后,对网页内某个链接指向的页面感兴趣,于是点击该链接,进入第2 个页面,此时虚拟时钟再次计时,时钟走向字2,如果网页包含了k 个出链,则用户从当前页面跳转到任意一个链接所指向页面的概率是相等的。用户不断重复以上过程,在相互有链接指向的页面之间跳转。如果对于某个页面所包含的所有链接,用户都没有兴趣继续浏览,则可能会在浏览器中输入另外一个网址,直接到达该网页,这个行为称为远程跳转(Teleporting)。假设互联网中共有m 个页面,则用户远程跳转到任意一个页面的概率也是相等的,即为1/m。随机游走模型就是一个对直接跳转和远程跳转两种用户浏览行为进行抽象的概念模型。

 
(点击查看大图)图6-4 随机游走模型示意图

下面我们给出一个具体的随机游走模型的例子,为简单起见,该例子并未引入远程跳转行为。

在如图6-5 所示的例子里,假设互联网由A、B、C 3 个网页构成,其相互链接关系如图中页面节点之间的有向边所示。根据链接关系,即可计算页面节点之间的转移概率,比如对于节点A 来说,只有唯一一个出链指向节点B,所以从节点A 跳转到节点B 的概率为1,对于节点C 来说,其对节点A 和B 都有链接指向,所以转向任意一个其他节点的概率为1/2。

 
(点击查看大图)图6-5 随机游走模型示例

假设在时刻1,用户浏览页面A,之后经由链接进入页面B,然后进入页面C,此时面临两种可能选择,跳转进入页面A 或者页面B 皆可,两者概率相同,都为1/2。

假设例子中的互联网包含不止3 个页面,而是由10 个页面构成,此时用户既不想跳回页面A,也不想跳回页面B,则可以按照1/10 的概率跳入其他任意一个页面,即进行远程跳转。

转载:随机游走模型

随机游走模型(Random Surfer Model)相关推荐

  1. 随机游走(Random Walk)模型

    Random Walk Model 1 模型及性质简介 给定一随机变量u(i)={1,−1}u(i)={\{1, -1\}}u(i)={1,−1} 随机游走模型可表示为随时间ttt变化的函数y(t)= ...

  2. Meta Path Based Random Walk复现思路【基于元路径的随机游走模型】

    title: Meta Path Based Random Walk date: 2022-02-13 00:43:08 tags: NLP的一些收获 课题原因需要复现ARNN模型.即"An ...

  3. matlab 指定区域随机游走_了解随机游走模型和移动平均过程(Python)

    在本文中,我将介绍两个能够对时间序列进行建模的模型:随机游走和移动平均过程. 随机游走模型 随机游走模型由以下公式表示: 换句话说,当前时刻t的位置是前一时刻(t-1)的位置与噪声(用z表示)之和.这 ...

  4. 自然语言处理(六)图的随机游走模型与噪声信道模型与条件随机场

    图的随机游走模型非常适用于统计网页的权重,在文本处理方面则适用于提取关键字,生成人物关系网等. 噪声信道模型本质上就是贝叶斯,它能直接适用于翻译,对于文本简单替换的微博文本规范化来说,感觉还更简单了, ...

  5. 【蚊子无人机】基于matlab随机游走模型无人机消除蚊子路径规划【含Matlab源码 2433期】

    ⛄一.随机游走模型 随机游走模型是通过随机选取某一文献作为起点,随机游走所有的文献,根据信息特征相似性对游走线路作加权处理,查阅所有文献后完成聚类. 随机游走算法通过对数据集进行统一的定义,把给定的数 ...

  6. 随机游走模型 matlab,基于随机游走的图像分割matlab代码

    [实例简介] 利用随机游走模型对图像进行了分割 编程环境是matlab 含有示例图片 可以直接运行 [实例截图] [核心代码] Randomwalksforimagesegmentation_matl ...

  7. (未完成)随机游走模型

    随机游走模型 //2014年6月20日入"未完成" 随机游走的来源 随机游走本来是"物理上布朗运动"相关的分子,还是微观粒子的运动形成的一个模型. 现在过多的谈 ...

  8. Python随机游走模型

    Python数据分析3 Python随机游走模型 Python随机游走模型 from random import choice class RandomWalk():def __init__(self ...

  9. 时间序列R语言操作2——白噪声和随机游走模型

    文章目录 一.白噪声 1.白噪声是什么? 2.白噪声的性质 3.样本自相关函数 4.白噪声检验 二.随机游走模型 1.简单随机游走序列 2.R语言 3.实例说明 1.醉汉回家 2.久赌必输 一.白噪声 ...

最新文章

  1. 您的关注是我最大的快乐
  2. php拆分jsion_PHP拆分YAPI导出的swagjson文件
  3. nyoj841最高位数字
  4. java 应用是单机集群_【架构】Tomcat单机部署多应用Windows
  5. python单元测试框架unittest介绍和使用_Python+Selenium框架设计篇之-简单介绍unittest单元测试框架...
  6. html5svg在线编辑器,SVG to Canvas在线转换工具
  7. Snabbdom(虚拟dom-h函数)
  8. nao机器人行走速度_数计学院学子在2020世界机器人大赛总决赛中荣获佳绩!
  9. 6467t 1080php,DM6467T开发板领航——开发环境的文件配置
  10. 第五步_安装编译必须的软件包依赖包
  11. 计算机制作贺卡教案,制作贺卡教案
  12. oracle存储过程菜鸟教程,SQL 简介
  13. 【DPDK】网卡绑定和解绑步骤
  14. Springboot集成海康SDK(以海康USB_SDK为例)
  15. 改变屏幕显示方向,让屏幕显示旋转
  16. 一样的操作,同样的引入,爆红:can’t resolve symbol
  17. 美国计算机生物学大学,美国计算机大学排名
  18. BlockingQueue 详解
  19. 显卡mx150和230哪个好_MX250和MX150哪个好
  20. LCD Keypad Shield

热门文章

  1. (微服务) Dubbo服务治理
  2. Kali Linux信息收集工具栏之Dmitry tools(工具)
  3. c++软开需要的知识
  4. C# 接收JObject数据
  5. 《你也能看得懂的Python算法书》学习笔记(四)
  6. Visual Studio 2019 如何在一个项目中添加多个可执行程序?
  7. ARM指令中如何判断一个立即数是 有效立即数
  8. 分享一些项目给正在学习编程的童鞋们(转)
  9. 什么是死锁?死锁产生的原因?如何避免死锁?
  10. Docker的好处作用