数学之美

最近在读《数学之美》这本书,做一下个人笔记。看的是PDF,看完后会买一本的哦!版权意识还是有的。

ps:图片文字都是这本书中的内容,侵权立删。会有点自己的理解。

第十章    PageRank

Google的民主表决式网站排名技术

1    PageRank算法的原理

核心思想:如果一个网页被很多其他网页所链接,说明它受到普遍的承认和信赖,那么它的排名就高。

对于来自不同网页的链接区别对待,来自排名高的网页的链接更可靠,给予高权重。

网页排名的计算:

pagerank = 0.001 + 0.01 + 0.02 + 0.05 = 0.081

X1,X2,X3,X4的权重依靠网站排名,那么这四个排名得出来呢?

布林把这个问题变成了一个二维矩阵相乘的问题,并用迭代的方法解决了这个问题。实际中计算量的问题,用稀疏矩阵计算的技巧实现了。

网页排名算法的高明之处在于它把整个互联网当作一个整体来对待,符合系统论的观点。

今天,决定搜索质量最有用的信息是用户的点击数据。

2    延伸阅读:PageRank的计算方法

假定向量B = (b1,b2,...,bn)T

为第一、第二、...第N个网页的网页排名。矩阵

为网页之间链接的数目。A是已知的,B是未知的(要求的)

假定Bi是第i次迭代的结果,那么Bi = A*Bi-1

初始假设:所有网页的排名都是1/N,即

显然可以通过Bi = A*Bi-1简单算出B1,B2,...。可以证明Bi最终会收敛,即Bi无限趋近于B,此时B = B*A。一般10次左右的迭代基本上就收敛了。

由于网页之间链接的数量相比互联网的规模非常稀疏,因此计算网页的网页排名也需要对零概率或者小概率事件进行平滑处理。网页的排名是个一维向量,对它的平滑处理只能利用一个小的常数α。这时:

其中N为互联网网页的数量,α是一个较小的常数,I是单位矩阵。

《数学之美》——第十章 个人笔记相关推荐

  1. 《数学之美》-吴军 读书笔记

    从吴军的<数学之美>找到了伽莫夫的<从一到无穷大>,前段时间先整理了<从一到无穷大>的笔记.现在整理下<数学之美>以巩固下. 近段时间AlfaGo 与人 ...

  2. 《数学之美》——吴军#读书笔记

    <数学之美> 吴军 第一章:文字和语言vs数字和信息 主要内容概述:"语言和数学的产生都是为了同一个目的--记录和传播信息".科技是伴随着人类的不断进化而发展进步的.信 ...

  3. 《数学之美》吴军-读书笔记

    信息的冗余是信息安全的保障. 早起数字并没有书写的形式,而是掰指头,这就是我们今天使用十进制的原因. 1970年以后统计语言学的出现使得自然语言处理重获新生,并取得了今天的非凡成就. 一个句子是否合理 ...

  4. 吴军《数学之美》部分概念笔记(1-11章)

    相关参考资料见正文 Good-turing模型: 由于我们是估算对于一个位置上出现单词wi的概率.这种情况下,在样本库中没有出现的单词,其概率并非为0. 但由于已有的Nr`r的累计和已经达到了1,所以 ...

  5. 【读书笔记】数学之美(下)

    作者:LogM 本文原载于 https://segmentfault.com/u/logm/articles,不允许转载~ 本文为旧博客文章,数学公式显示不正常,请至 https://segmentf ...

  6. 数学之美-隐含马尔可夫模型-笔记

    <数学之美>吴军 著 第二版 --读书笔记 原理 通信模型: Created with Raphaël 2.1.2信息.上下文信息.上下文传递的信息传递的信息接收的信息接收的信息(s1,s ...

  7. 吴军《数学之美》-读书笔记

    <数学之美>读书笔记 前言 第一章-文字和语言 vs 数字和信息 第二章-自然语言处理(从规则到统计) 第三章-统计语言模型 前言 本来想把题目写作读后有感或者叫什么心得体会,但是斟酌之后 ...

  8. 数学之美-读书笔记6-10章

    文章目录 数学之美 第六章 信息的度量和作用 1信息熵 2信息的作用 3互信息 4延伸阅读 第7章 贾里尼克和现代语言处理 1早年生活 2 从水门事件到莫妮卡·莱文斯基 3一位老人的奇迹 第八章 简单 ...

  9. 【读书笔记】《数学之美》——一个好方法在形式上总是简单的

    数学之美 作者简介 内容简介 摘抄语录 收获感悟 牛顿曾说"(人们)发觉真理在形式上从来是简单的,而不是复杂和含混的."数学的美妙之处在于它对自然界史诗的总结和归纳,也是抽象思考的 ...

最新文章

  1. img src=/引发的问题
  2. 全球最美的15座数据中心
  3. 【AWSL】之Linux系统安全及应用(su、PAM、sudo、GRUB、JR、NMAP)
  4. node 加密解密模块_NODE.JS加密模块CRYPTO常用方法介绍
  5. Shell第二篇:正则表达式和文本处理工具
  6. python利用win32com实现doc文档转为pdf文档的功能
  7. java的mysql语句规范_常用的标准SQL 语句
  8. 深度学习笔记(13) Softmax分类
  9. android 创建模拟器打不开,解决Android模拟器打不开的问题!...
  10. C ++标准是否允许未初始化的bool使程序崩溃?
  11. mac ~/.bash_profile 重启失效
  12. opencv打开双目,采集标定双目的图片
  13. 【基础教程】基于matlab图像去噪总结【含Matlab源码 1274期】
  14. 女黑客登场:轻松破解APP,共享单车任我骑!
  15. cmd命令窗口快捷键与小技巧
  16. 30天完成700万营业额,这家珠宝店的营销模式,值得借鉴!
  17. java超链接颜色_Java技巧(一):会变色的超链接
  18. 这5个摸鱼神器太火了!程序员:知道了快删!
  19. 深度学习-各类梯度下降优化算法回顾
  20. 分享一份软件测试项目(Python项目)

热门文章

  1. 作为数据分析师怎样选择适合你的分析工具?
  2. 各大券商提供的量化终端怎么样?
  3. mysql设置了远程连接查不到视图_mysql服务设置远程连接 解决1251 client does not support ..问题...
  4. c++ opencv mat_海思平台OpenCV编译与进一步裁剪
  5. 情人节表白代码(1)
  6. 运维基本功(十二): Linux命令回顾与扩展
  7. markdown编辑器教程
  8. 一对一直播交友APP的核心开发要点,小而美的APP出路吗?
  9. Pretty girl你一定要会管理自己的身体
  10. Java web批量导入excel表格的数据进入数据库的实现