论泰勒级数的家庭地位

胖友们,很久没见了,最近工作确实太忙。离上一篇文章的时间已经有一个多月了。上回说到学习python占用了我很大部分的时间。但是在一次我面试别人与别人的交流中,我醒悟到了一些机器学习理论基础的重要性,最近多花了一些时间这方面的学习上。因为在一些业务场景中,我们在建模的时候必须要知道怎样样的算法才能结合业务产生价值,那算法理论就是我们的基础。在学习的过程中,我发现泰勒级数在机器学习理论中经常用到,如xgboost的推导。但是在跟一些朋友的交流中,他们会提问,他们虽然大致知道泰勒级数式长什么样的,但一些背景和详细解释没有太了解,导致在后面的学习中一脸懵逼,没办法把知识点串联起来。所以这次想看看我们这次的学习分享能不能帮到大家。那么我们应该怎么去理解泰勒级数和泰勒级数在机器学习领域中的应用?我们可以从泰勒级数的定义和它在机器学习中的应用例子说起。

01泰勒级数是什么

泰勒级数是以于1715年发表了泰勒公式的英国数学家布鲁克·泰勒(Sir Brook Taylor)的名字来命名的。通过函数在自变量零点的导数求得的泰勒级数又叫做迈克劳林级数,以苏格兰数学家科林·麦克劳林的名字命名。泰勒级数是因为需要用一个多项式来逼近所有函数而产生。一个函数f(x)只要满足在含有以下公式点a的某个区间I内有任意阶导数,就能使用泰勒级数去逼近f(x),而且最后级数需要收敛。

泰勒级数公式如下:

可以看到,f(x)最后通过一系列的多项式去表示。这就是泰勒级数的作用,用一系列多项式去逼近一个函数。

02熵与gini指数的关系

先解释什么是熵,记得之前的文章已经有些涉及。熵是一种不确定性的度量,可以用来度量决策树分裂过程中的分裂效果。熵越大说明一个集合中的类别分别越不明确。gini指数也是一样的含义。

两者的公式对比如下:

在公式中,Pk代表在集合中k类别的占比,所以可以根据Pk计算熵和基尼指数。后面就能用到利用泰勒级数让熵近似转化为基尼指数。我们让f(x)=-lnx在x=1处进行一阶泰勒展开:

f(x)

≈f(x0)+f(x)´∗(x−x0)+0(′)=f(1)+f(1)´∗(x−1)+0(′)=1−x

根据上面的关系我们就能看到-ln(Pk)=1-Pk,最后得到熵H(x)和Gini(x)近似相等。

03XGboost中的应用

当把上面泰勒级数中的x赋值为a+Δx,让x在x=a处泰勒二阶展开,得到:

f(a+Δx)≈f(a)+f(a)´∗Δx+f(a)′′∗(Δx)2/2

XGboost的损失函数为以下目标函数,我们这边不详细讨论以下等式的细节,可以详见之前讲解XGboost的文章《XGboost原理基础直梯度提升树》,这里主要描述的是泰勒级数在这个XGboost中的应用。

而:

所以:

在等式中

相当于泰勒二阶展开式中的a+Δx,

相当于x ,相当于Δx,所以得到:

等于

最后得到:.

所以总的来说,以上的转换需要泰勒级数在整个过程中的使用。

04梯度下降法中的应用

最后的一个例子就是大家经常见的梯度下降法。我们目标是最小化损失函数,参数迭代公式为:

θt=θt−1+Δθ

我们把损失函数在θt−1处泰勒一阶展开,得到:

L(θt)=L(θt−1+Δt)≈L(θt−1)+L(θt−1)′∗Δx

为了让我们的损失函数是越来越小的,即下一步迭代的L(θt)小于L(θt−1),有以下推导:

L(θt)=>  L(θt)-L(θt−1)=L(θt−1)′∗Δx<0

那么我们控制Δx,令Δx=−α*L(θt−1)′,然后再控制α>0,那样代入上面的式子就能保证L(θt)-L(θt−1)<0,在每一步迭代之后,损失函数都在减少。最后就能最小化损失函数。当然我们给的只是一种梯度下降的例子,实际上在别的梯度下降算法中α值不是固定的,大家有兴趣我们可以跟多交流。

//最后的感悟//

总的来说,如果在我们数据建模这一行,业务和模型都很重要,没有了业务理解,我们没有了让模型产生价值的方向,做出来的模型没办法落地。没有模型算法的基本理解,就没有建模的基础,也无从下手,而模型算法的基础中数学基础也很重要,以上泰勒级数在机器学习中的三个例子也有一定的说明。所以我们在下班之余可以多学习一些模型算法并且思考怎么结合业务实际,使它有落地的价值,然后才能升职加薪,迎娶白富美,成为人生赢家啦。

泰勒公式推导过程_论泰勒级数在机器学习家庭中的地位相关推荐

  1. 泰勒公式推导过程_#泰勒#(Taylor)公式真的很难很难吗?

    编编因为好久没有写文案了,所以就有不少读者朋友前来催更了,哈哈看到今天文章的题目啦,就知道这一期我们要讲泰勒公式了.作为重名明星Taylor Swift的忠实粉丝,本期编编当然是要推送她的歌曲啦.话说 ...

  2. 三个数差的平方公式推导过程_平方和公式推导过程(一个自然数立方和高中数学知识点总结)...

    平方和,数学术语,定义为2个或多个数的平方相加.通常是一些正整数的平方之和,整数的个数可以是有限个,也可以是无限多. 平方公式(a+b)^2=a^2+b^2+2ab,其中a^2+b^2是平方和. 平方 ...

  3. 三个数差的平方公式推导过程_学懂因式分解 你只差这8个完全平方公式推导结论 立马见效...

    大家好!我是涵姐又和大家见面了. 本期继续上期整式的乘法和因式分解章节中乘法公式里的考点2--完全平方公式 完全平方公式是进行代数运算与变形的重要的知识基础,是整式的乘法和因式分解中常用到的公式.该考 ...

  4. 三个数差的平方公式推导过程_勾股数公式的简单推导

    勾股数 是指满足 的正整数,它们的通用公式为 ,下边我从定义出发,利用平方差公式举例实验找规律,推导出这一通用公式. 由 可知 当 为奇数时 和 全都是奇数:当 为偶数时 和 全都是偶数.( ,与 同 ...

  5. 三个数差的平方公式推导过程_万有引力常量反复测量不“常”咋回事?新常量公式诠释引力本质...

    一.万有引力常量的历史 1687 年牛顿在于<自然哲学的数学原理>阐述了万有引力定律:指出任意两个物体的引力大小与它们质量的乘积成正比,与它们距离的平方成反比. 但是,牛顿在推出万有引力定 ...

  6. 三个数差的平方公式推导过程_平方差公式证明推导过程及运用详解(数学简便计算方法之一)...

    ​平方差公式是小学奥数计算中的常用公式. 通常写为:a²-b²=(a+b)x(a-b) 它的几何方法推导过程是这样的: 如下图所示,四边形ABCD和四边形DEFG为正方形,边长分别为a和b,求阴影部分 ...

  7. 三个数差的平方公式推导过程_立方和与立方差公式的推导过程

    展开全部 a³+b³=a³+a²b-a²b+b³=a²(e68a84e8a2ad62616964757a686964616f31333365643661a+b)-b(a²-b²)=a²(a+b)-b( ...

  8. python 回归去掉共线性_一文讲解机器学习算法中的共线性问题

    多重共线性是使用线性回归算法时经常要面对的一个问题.在其他算法中,例如决策树和贝叶斯,前者的建模过程是逐步递进,每次拆分只有一个变量参与,这种建模机制含有抗多重共线性干扰的功能:后者干脆假定变量之间是 ...

  9. 凸优化 机器学习 深度学习_我应该在机器学习项目中使用哪个优化程序

    凸优化 机器学习 深度学习 This article provides a summary of popular optimizers used in computer vision, natural ...

最新文章

  1. spss聚类分析_SPSS聚类分析 I K均值聚类法案例实操
  2. LaTeX 简介与安装
  3. sqoop配置与使用
  4. P4245 【模板】任意模数NTT
  5. mysql数据库操作语句大全
  6. Special Numbers 进制(1100)
  7. linux 定时器中断 imx,NXP iMX8 存储性能测试
  8. YbtOJ#526-折纸游戏【二分,hash】
  9. 【转】使用JMeter对数据库做压力测试
  10. 攻破Win7~Win10 PatchGuard(KPP DSE)【支持Win10 TH1/TH2/RS1/RS2】【WIN64内核越狱】
  11. 【拿不到offer全额退款】人工智能与 NLP / CV 第三期课程培训招生
  12. h5评论直接显示代码_全套H5教程免费学,让你0基础自学制作H5页面
  13. 简单的优化mysql,提高查询性能
  14. 2.企业应用架构模式 --- 组织领域逻辑
  15. [软广]某数据领域在线教育机构
  16. 第03讲 struts2中ActionSupport引入
  17. Unity3d 代码修改并恢复鼠标的图标
  18. 设备无法连接到你的计算机,此硬件设备未连接到计算机(代码45) | MOS86
  19. python微信接龙转Excel表格
  20. 经典文章:一位营销总监的辞职信及回复

热门文章

  1. ci 文件类型在禁止上传之列
  2. 重建DC的DNS区域
  3. 自动化运维工具Ansible详细部署
  4. jQuery (DOM篇)
  5. DB2数据库常用工具
  6. 数论 - 简单数位推理 --- NYIST 514
  7. js中substring和substr的用法
  8. Tautology--POJ 3295
  9. js在firefox中的问题
  10. Sublime text 3 汉化教程