数学之美 第三版

  • 第1章 文字和语言 vs 数字和信息
  • 第2章 自然语言处理——从规则到统计
  • 第3章 统计语言模型
  • 第4章 谈谈分词
  • 第5章 隐马尔可夫模型
  • 第6章 信息的度量和作用
  • 第7章 贾里尼克和现代语言处理
  • 第8章 简单之美——布尔代数和搜索引擎
  • 第9章 图论和网络爬虫
  • 第10章 PageRank——Google的民主表决式网页排名技术
  • 第11章 如何确定网页和查询的相关性
  • 第12章 有限状态机和动态规划——地图与本地搜索的核心技术
  • 第13章 Google AK-47的设计者——阿米特·辛格博士
  • 第14章 余弦定理和新闻的分类
  • 第15章 矩阵运算和文本处理中的两个分类问题
  • 第16章 信息指纹及其应用
  • 第17章 由电视剧《暗算》所想到的——谈谈密码学的数学原理
  • 第18章 闪光的不一定是金子——谈谈搜索引擎反作弊问题和搜索结果的权威性问题
  • 第19章 谈谈数学模型的重要性
  • 第20章 不要把鸡蛋放到一个篮子里——谈谈最大熵模型
  • 第21章 拼音输入法的数学原理
  • 第22章 自然语言处理的教父马库斯和他的优秀弟子们
  • 第23章 布隆过滤器
  • 第24章 马尔可夫链的扩展——贝叶斯网络
  • 第25章 条件随机场、文法分析及其他
  • 第26章 维特比和他的维特比算法
  • 第27章 上帝的算法——期望最大化算法
  • 第28章 逻辑回归和搜索广告
  • 第29章 各个击破算法和Google云计算的基础
  • 第30章 Google大脑和人工神经网络
  • 第31章 区块链的数学基础——椭圆曲线加密原理
  • 第32章 大数据的威力——谈谈数据的重要性
  • 第33章 随机性带来的好处——量子密钥分发的数学原理
  • 第34章 数学的极限——希尔伯特第十问题和机器智能的极限
  • 附录 计算复杂度
  • 第三版后记
  • 索引

第1章 文字和语言 vs 数字和信息

文字和语言与数学,从产生起原本就有相通性,虽然它们的发展一度分道扬镳,但是最终还是能走到一起。
1 信息
2 文字和数字
3 文字和语言背后的数学

第2章 自然语言处理——从规则到统计

人类对机器理解自然语言的认识走了一条大弯路。早期的研究集中采用基于规则的方法,虽然解决了一些简单的问题,但是无法从根本上将自然语言理解实用化。直到20多年后,人们开始尝试用基于统计的方法进行自然语言处理,才有了突破性进展和实用的产品。
1 机器智能
2 从规则到统计

第3章 统计语言模型

统计语言模型是自然语言处理的基础,并且被广泛应用于机器翻译、语音识别、印刷体,或手写体识别、拼写纠错、汉字输入和文献查询。
1 用数学的方法描述语言规律
2 延伸阅读:统计语言模型的工程诀窍

第4章 谈谈分词

中文分词是中文信息处理的基础,它同样走过了一段弯路,目前依靠统计语言模型已经基本解决了这个问题。
1 中文分词方法的演变
2 延伸阅读:如何衡量分词的结果

第5章 隐马尔可夫模型

隐马尔可夫模型最初应用于通信领域,继而推广到语音和语言处理中,成为连接自然语言处理和通信的桥梁。同时,隐马尔可夫模型也是机器学习的主要工具之一。
1 通信模型
2 隐马尔可夫模型
3 延伸阅读:隐马尔可夫模型的训练

第6章 信息的度量和作用

信息是可以量化度量的。信息熵不仅是对信息的量化度量,也是整个信息论的基础。它对于通信、数据压缩、自然语言处理都有很强的指导意义。
1 信息熵
2 信息的作用
3 互信息
4 延伸阅读:相对熵

第7章 贾里尼克和现代语言处理

作为现代自然语言处理的奠基者,贾里尼克教授成功地将数学原理应用于自然语言处理领域中,他的一生富于传奇色彩。
1 早年生活
2 从水门事件到莫妮卡·莱温斯基
3 一位老人的奇迹

第8章 简单之美——布尔代数和搜索引擎

布尔代数虽然非常简单,却是计算机科学的基础,它不仅把逻辑和数学合二为一,而且给了我们一个全新的视角看待世界,开创了数字化时代。
1 布尔代数
2 索引

第9章 图论和网络爬虫

互联网搜索引擎在建立索引前需要用一个程序自动地将所有的网页下载到服务器上,这个程序称为网络爬虫,它的编写是基于离散数学中图论的原理。
1 图论
2 网络爬虫
3 延伸阅读:图论的两点补充说明

第10章 PageRank——Google的民主表决式网页排名技术

网页排名技术PageRank是早期Google的杀手锏,它的出现使得网页搜索的质量上了一个大的台阶。它背后的原理是图论和线性代数的矩阵运算。
1 PageRank算法的原理
2 延伸阅读:PageRank的计算方法

第11章 如何确定网页和查询的相关性

确定网页和查询的相关性是网页搜索的根本问题,其中确定查询中每个关键词的重要性有多高是关键。TF-IDF是目前通用的关键词重要性的度量,其背后的原理是信息论。
1 搜索关键词权重的科学度量TF-IDF
2 延伸阅读:TF-IDF 的信息论依据

第12章 有限状态机和动态规划——地图与本地搜索的核心技术

地图与本地搜索中要用到有限状态机和动态规划技术。这两项技术是机器智能和机器学习的工具,它们的应用非常广泛,还包括语音识别、拼写和语法纠错、拼音输入法、工业控制和生物的序列分析等。
1 地址分析和有限状态机
2 全球导航和动态规划
3 延伸阅读:有限状态传感器

第13章 Google AK-47的设计者——阿米特·辛格博士

在所有轻武器中最有名的是AK-47冲锋枪,因为它从不卡壳,不易损坏,可在任何环境下使用,可靠性好,杀伤力大并且操作简单。Google的产品就是按照上述原则设计的。

第14章 余弦定理和新闻的分类

计算机虽然读不懂新闻,却可以准确地对新闻进行分类。其数学工具是看似毫不相干的余弦定理。
1 新闻的特征向量
2 向量距离的度量
3 延伸阅读:计算向量余弦的技巧

第15章 矩阵运算和文本处理中的两个分类问题

无论是词汇的聚类还是文本的分类,都可以通过线性代数中矩阵的奇异值分解来进行。这样一来,自然语言处理的问题就变成了一个数学问题。
1 文本和词汇的矩阵
2 延伸阅读:奇异值分解的方法和应用场景

第16章 信息指纹及其应用

世间万物都有一个唯一标识的特征,信息也是如此。每一条信息都有它特定的指纹,通过这个指纹可以区别不同的信息。
1 信息指纹
2 信息指纹的用途
3 延伸阅读:信息指纹的重复性和相似哈希

第17章 由电视剧《暗算》所想到的——谈谈密码学的数学原理

密码学的根本是信息论和数学。没有信息论指导的密码是非常容易被破解的。只有在信息论被广泛应用于密码学后,密码才真正变得安全。
1 密码学的自发时代
2 信息论时代的密码学

第18章 闪光的不一定是金子——谈谈搜索引擎反作弊问题和搜索结果的权威性问题

闪光的不一定是金子,搜索引擎中排名靠前的网页也未必是有用的网页。消除这些作弊网页的原理和通信中过滤噪声的原理相同。这说明信息处理和通信的很多原理是相通的。
1 搜索引擎的反作弊
2 搜索结果的权威性

第19章 谈谈数学模型的重要性

正确的数学模型在科学和工程中至关重要,而发现正确模型的途径常常是曲折的。正确的模型在形式上通常是简单的。

第20章 不要把鸡蛋放到一个篮子里——谈谈最大熵模型

最大熵模型是一个完美的数学模型。它可以将各种信息整合到一个统一的模型中,在信息处理和机器学习中有着广泛的应用。它在形式上非常简单、优美,而在实现时需要有精深的数学基础和高超的技巧。
1 最大熵原理和最大熵模型
2 延伸阅读:最大熵模型的训练

第21章 拼音输入法的数学原理

汉字的输入过程本身就是人和计算机之间的通信。好的输入法会自觉或不自觉地遵循通信的数学模型。当然要做出最有效的输入法,应当自觉使用信息论做指导。
1 输入法与编码
2 输入一个汉字需要敲多少个键——谈谈香农第一定理
3 拼音转汉字的算法
4 延伸阅读:个性化的语言模型

第22章 自然语言处理的教父马库斯和他的优秀弟子们

将自然语言处理从基于规则的研究方法转到基于统计的研究方法上,宾夕法尼亚大学的教授米奇·马库斯功不可没。他创立了今天在学术界广泛使用的LCD语料库,同时培养了一大批精英人物。
1 教父马库斯
2 从宾夕法尼亚大学走出的精英们

第23章 布隆过滤器

日常生活中,经常要判断一个元素是否在一个集合中。布隆过滤器是计算机工程中解决这个问题最好的数学工具。
1 布隆过滤器的原理
2 延伸阅读:布隆过滤器的误识别问题

第24章 马尔可夫链的扩展——贝叶斯网络

贝叶斯网络是一个加权的有向图,是马尔可夫链的扩展。而从认识论的层面看:贝叶斯网络克服了马尔可夫链那种机械的线性约束,它可以把任何有关联的事件统一到它的框架下面。它在生物统计、图像处理、决策支持系统和博弈论中都有广泛的使用。
1 贝叶斯网络
2 贝叶斯网络在词分类中的应用
3 延伸阅读:贝叶斯网络的训练

第25章 条件随机场、文法分析及其他

条件随机场是计算联合概率分布的有效模型,而句子的文法分析似乎是英文课上英语老师教的东西,这两者有什么联系呢?
1 文法分析——计算机算法的演变
2 条件随机场
3 条件随机场在其他领域的应用

第26章 维特比和他的维特比算法

维特比算法是现代数字通信中使用最频繁的算法,也是很多自然语言处理采用的解码算法。可以毫不夸张地讲,维特比是对我们今天的生活影响力最大的科学家之一,因为基于CDMA的3G移动通信标准主要就是他和厄文·雅各布创办的高通公司制定的。
1 维特比算法
2 CDMA技术——3G移动通信的基础

第27章 上帝的算法——期望最大化算法

只要有一些训练数据,再定义一个最大化函数,采用EM算法,利用计算机经过若干次迭代,就可以得到所需要的模型。这实在是太美妙了,这也许是造物主刻意安排的,所以我把它称作上帝的算法。
1 文本的自收敛分类
2 延伸阅读:期望最大化和收敛的必然性

第28章 逻辑回归和搜索广告

逻辑回归模型是一种将影响概率的不同因素结合在一起的指数模型,它不仅在搜索广告中起着重要的作用,而且被广泛应用于信息处理和生物统计中。
1 搜索广告的发展
2 逻辑回归模型

第29章 各个击破算法和Google云计算的基础

Google颇为神秘的云计算中最重要的MapReduce工具,其原理就是计算机算法中常用的“各个击破”算法,它的原理原来这么简单——将复杂的大问题分解成很多小问题分别求解,然后再把小问题的解合并成原始问题的解。由此可见,在生活中大量用到的、真正有用的方法常常都是简单朴实的。
1 分治算法的原理
2 从分治算法到MapReduce

第30章 Google大脑和人工神经网络

Google大脑并不是一个什么都能思考的大脑,而是一个很能计算的人工神经网络。因此,与其说Google大脑很聪明,不如说它很能算。不过,换个角度来说,随着计算能力的不断提高,计算量大但简单的数学方法有时能够解决很复杂的问题。
1 人工神经网络
2 训练人工神经网络
3 人工神经网络与贝叶斯网络的关系
4 延伸阅读:Google大脑

第31章 区块链的数学基础——椭圆曲线加密原理

希尔伯特讲,“我们直到能够把一门自然科学的数学内核剥出并完全地揭示出来,才能够掌握它。”以比特币为代表的加密货币的基础是数学的算法,只有搞清楚加密货币的数学内核,我们才能了解它的本质。
1 不对称、不透明之美
2 椭圆曲线加密的原理

第32章 大数据的威力——谈谈数据的重要性

如果说在过去的40年里,主导全球IT产业发展的是摩尔定律,那么在今后的20年里,主导IT行业继续发展的动力则将来自于数据。
1 数据的重要性
2 数据的统计和信息技术
3 为什么需要大数据

第33章 随机性带来的好处——量子密钥分发的数学原理

人们总是喜欢确定性而不喜欢随机性。但是从对确定性规律的把握上升到对随机性规律的把握,恰恰是近代数学进步的标志。量子通信就是建立在把握了有关随机性规律的基础之上。
1 用(激光)量子的偏振方向传递信息
2 利用随机性保证信息安全

第34章 数学的极限——希尔伯特第十问题和机器智能的极限

世界上只有一小部分问题是数学问题,而数学问题中又只有极小的一部分问题有解。在这些问题中,今天已经找到相应算法的少之又少。因此,数学不是万能的,我们需要了解数学的边界在哪里。
1 图灵划定计算机可计算问题的边界
2 希尔伯特划定有解数学问题的边界
3 延伸阅读:关于图灵机

附录 计算复杂度

第三版后记

索引

数学之美 第三版 目录相关推荐

  1. 吴军《数学之美》第二版阅读整理

    吴军的<数学之美>第一版于2012年出版,并获得国家图书馆第八届文津图书奖.我读的是第二版(再版),作者在第一版的基础上又增加了一些内容. 作者大有来头(IT行业),吴军博士,毕业于清华大 ...

  2. 鸟哥的Linux私房菜基础篇第三版 -- 目录

    服务器端使用的OS,Linux是最最常用的,所以,日常的部署.排查问题,就不可避免的与Linux打交道,日积月累,对Linux就有了多多少少的了解. 反过来,再系统的从头开始,读一本关于Linux基础 ...

  3. 数学之美 系列三 -- 隐含马尔可夫模型在语言处理中的应用

    发表者:吴军,Google 研究员 前言:隐含马尔可夫模型是一个数学模型,到目前为之,它一直被认为是实现快速精确的语音识别系统的最成功的方法.复杂的语音识别问题通过隐含马尔可夫模型能非常简单地被表述. ...

  4. 注入游戏没有焦点_数独游戏 数学之美(三)

    一揭晓上期答案同学们,上周的数独题目你们做对了吗?让我们一起来看看正确答案吧! 二学生讲解数独游戏是一种非常益智的推理游戏,它可以提高你的逻辑思维能力.让我们来听一听这位同学的解题思路吧!三讲解新知这 ...

  5. java面向对象程序设计(jdk1.6)第三版 目录页数_Java面向对象程序设计/普通高等教育计算机规划教材简介,目录书摘...

    目录: 出版说明 前言 第1章  面向对象程序设计基础 1.1  结构化方法与结构化程序设计 1.2  面向对象方法与面向对象程序设计 1.3  面向对象程序设计的基本概念和特征 1.4  统一建模语 ...

  6. 浅谈《数学之美》①——自然语言处理

    小编看的书吴军博士的<数学之美>第二版,最近看完了前七章,做个小总结吧,毕竟本书的知识还是很值得去细细品味(虽然很多看不懂....),算是读书笔记吧,但是本书个人认为不是很适合不知道基础知 ...

  7. 黑客秘笈-渗透测试实用指南 第三版

    黑客秘笈-渗透测试实用指南 第三版 目录 前言 提示和免责声明 介绍 渗透测试团队与红队 总结 第1章 赛前准备--安装 假定攻破练习 设定你的行动 设置你的外部服务器 红队的核心工具 Metaspl ...

  8. 豆瓣8.9,《数学之美》第三版,让你10分钟爱上数学

    文末赠书 14年前,"数学之美"系列文章首载于谷歌黑板报,即获得上百万次点击,凡阅文者,皆叹相见恨晚,大学时痛恨万分的马尔可夫链.矩阵计算,甚至余弦函数等原来如此亲切,自然语言和信 ...

  9. ​ 每周一书《数学之美 第二版》分享!

    内容简介 几年前,"数学之美"系列文章原刊载于谷歌黑板报,获得上百万次点击,得到读者高度评价.读者说,读了"数学之美",才发现大学时学的数学知识,比如马尔可夫链 ...

  10. 拒绝从入门到放弃_《鸟哥的 Linux 私房菜 — 基础学习篇(第三版)》必读目录

    目录 目录 前言 关于这本书 必看知识点 最后 前言 相信部分刚进入这个行业的新同学会对一个问题感到疑惑,为什么从培训学校出来的学员不被欢迎? 这里记录下一些我个人的看法(博主也曾有面试新员工的经历) ...

最新文章

  1. 解决 apache 2.4.1 无法解析shtml中的expr指令问题
  2. Mysql默认密码的查找和修改
  3. js中hover事件时候的BUG以及解决方法
  4. python format函数实例_Python字符串格式化,format格式化函数详细使用
  5. LeetCode刷题之旅
  6. 【转】Loadrunner入门(《软件性能测试过程详解与案例剖析》)
  7. Linux 命令之 ls -- 列出指定目录下的内容
  8. 高职计算机专业用什么软件,【计算机专业论文】高职计算机专业CAD软件教学思考(共4772字)...
  9. 一个关于if else容易迷惑的问题(转自鸟哥公众号)
  10. MySQL (15)---UPDATE 更新
  11. java发微信字体颜色,微信公众号 模板消息 字体颜色 错位?
  12. SAP 移动类型详解 大全说明
  13. 比较常见的操作系统有哪些
  14. VUE项目中CSS设置动态宽度的方法
  15. Qt 添加 QtNetwork 库文件(包括vs中和qt中)
  16. 【计算机网络】吞吐量与瓶颈链路
  17. C语言 统计含有中文的字符串中的字数、 字符数和行数
  18. Migrating to Cloud-Native Application Architectures中文版《迁移到云原生应用架构》
  19. 桌面应用程序如何迁移至.NET Core / .NET 5?
  20. 第四周 Java语法总结_内部类_常用类_getclass_toStrong_equals_clone_Scanner_String_StringBuffer_Integer_集合_插入排序

热门文章

  1. 算法设计实验一单峰序列
  2. 【增强版】快速判断工作簿中是否存在指定工作表
  3. Asp.Net Core 系列教程 (一)
  4. 20145322何志威《网络对抗技术》Exp6 信息搜集技术
  5. 6个提高工作效率的技巧
  6. 计算机软件自启动设置,设置开机启动项,详细教您电脑如何设置开机启动项
  7. 用PROC FCMP创建函数
  8. 台式计算机 cpu型号大全,电脑cpu的型号有哪些?
  9. sslpinning实战
  10. Multiple Hypothesis Tracking Revisited