导数是人工智能、神经网络的基础,正向传播、反向传播无不依赖于导数,导数也是高数的基础,本文算是一个半学习半理解加非科班的学习过程吧

导数(Derivative),也叫导函数值。又名微商,是微积分中的重要基础概念。当函数y=f(x)的自变量x在一点x0上产生一个增量Δx时,函数输出值的增量Δy与自变量增量Δx的比值在Δx趋于0时的极限a如果存在,a即为在x0处的导数,记作f'(x0)或df(x0)/dx。

导数是变化率、是切线的斜率、是速度、是加速度

导数的本质是通过极限的概念对函数进行局部的线性逼近,从这个意义上讲是瞬时速度。

假设一辆车匀速前进,每小时时速为60公里,关于距离(y)、时速(常量60)和时间(x)的关系即y=f(x)=60*x

瞬间增量为 Δy=f(x0+Δx)-f(x0)

计算在某时刻的瞬间速度为f'(x0)=lim[Δx->0]Δy/Δx=lim[Δx->0](f(x0+Δx)-f(x0))/Δx=(60*(x0+Δx)-60*x0)/Δx=60

自由落体的公式是h=1/2gt^2(g为重力加速度,g=9.8m/s2),求某个时刻的速度,关于距离(y)、重力加速度(常量9.8)和时间(x)的关系即y=f(x)=1/2*9.8*x^2

瞬间增量为 Δy=f(x0+Δx)-f(x0)

计算在某时刻的瞬间速度为f'(x0)=lim[Δx->0]Δy/Δx=lim[Δx->0](f(x0+Δx)-f(x0))/Δx=(1/2*9.8*(x+Δx)^2-1/2*9.8*x^2)/Δx=4.9*(Δx^2+2Δx)/Δx=4.9Δx+9.8=9.8

f'(x)=lim[Δx->0](f(x0+Δx)-f(x0))/Δx=lim[Δx->0](f(x)-f(x-Δx))/Δx=lim[x->x0])(f(x)-f(x0))/(x-x0)

这个瞬间速度即导数也就是切线斜率,换成公式f'(x0)=(f(x)-f(x0))/(x-x0)

设曲线方程为y=f(x),曲线上某点为(a,f(a)),其切线方程应为 y=f'(a)(x-a)+f(a)

f'(x)=lim[Δx->0](f(x0+Δx)-f(x0))/Δx 表示为Δx无限接近0时的接近的值

导数的性质:

加法性质:{f(x)+g(x)}'=f'(x)+g'(x)

常量性质:{Cf(x)}'=Cf'(x)

除法性质:{1/f(x)}'=f'(x)/{f(x)}^2

当函数f(x)在x=a处取得最小值时,f'(a)=0,f'(a)=0是函数f(x)在x=a处取得最小值的必要条件

f'(x)<0,f(x)单调递减;f'(x)>0,f(x)单调递增

多变量函数

z=f(x,y),只看变量x,将y当作常数求导,即为关于x的偏导数

∂z/∂x=∂f(x,y)/∂x=lim[Δx=0](f(x+Δx,y)-f(x,y))/Δx

∂z/∂y=∂f(x,y)/∂y=lim[Δy=0](f(x,y+Δy)-f(x,y))/Δy

当z=wx+b

∂z/∂x=w,∂z/∂w=x,∂z/∂b=1

当z=w1x1+w2y2+b1,对x1,w2,b1求偏导

∂z/∂x1=w1

∂z/∂w2=x2

∂z/∂b1=1

当f(x,y)=3x^2+4y^2

∂z/∂x=∂f(x,y)/∂x=6x

∂z/∂y=∂f(x,y)/∂y=8y

多变量函数的最小值求法,拉格朗日乘数法

a+b=1,求1/a+4/b的最小值

z=f(a,b)=1/a+4/b

Φ(a,b)=a+b-1=0

F(a,b,λ)=f(x,y)+λΦ(x,y)=1/a+4/b+λ(a+b-1)

对a,b求导

F‘a(a,b,λ)=∂f(a,b,λ)/∂a=-1/a^2+λ=0

F‘b(a,b,λ)=∂f(a,b,λ)/∂b=-4/b^2+λ=0

Φ(a,b)=a+b-1=0

求解

λ=1/a^2=4/b^2

b=2a

a+b-1=0

a=1/3,b=2/3

zmin=f(1/3,2/3)=9

即约束条件构造为Φ函数,求解函数构造为f函数

构造F函数=f(x,y)+λΦ(x,y)

对F函数分别求偏导,配合约束条件,构成联立方程组,求x,y值

将x,y值带入求解方程即为最小值

复合函数求导

y=f(u),u=g(x)

dy/dx=(dy/du)*(du/dx)

y=f(u),u=g(v),v=z(x)

dy/dx=(dy/du)*(du/dv)*(dv/dx)

多变量复合函数求导

z=f(u,v),u=g(x,y),v=z(x,y)

∂z/∂x=(∂z/∂u)*(∂u/∂x)+(∂z/∂v)*(∂v/∂x)

∂z/∂y=(∂z/∂u)*(∂u/∂y)+(∂z/∂v)*(∂v/∂y)

例C=u^2+v^2,u=ax+by,v=px+qy(a,b,p,q为常数)

∂C/∂x=(∂C/∂u)*(∂u/∂x)+(∂C/∂v)*(∂v/∂x)=2ua+2vp=2a(ax+by)+2p(px+qy)

∂C/∂y=(∂C/∂u)*(∂u/∂y)+(∂C/∂v)*(∂v/∂y)=2ub+2vq=2b(ax+by)+2q(px+qy)

例C=u^2+v^2+w^2,u=a1x+b1y+c1z,v=a2x+b2y+c2z,w=a3x+b3y+c3z(ai,bi,ci为常数)

∂C/∂x=(∂C/∂u)*(∂u/∂x)+(∂C/∂v)*(∂v/∂x)+∂C/∂w)*(∂w/∂x)

=2u*a1+2v*a2+2w*a3

=2(a1x+b1y+c1z)*a1+2(a2x+b2y+c2z)*a2+2(a3x+b3y+c3z)*a3

导数是用来找到“线性近似”的数学工具

单变量函数的近似值

f'(x)=im[Δx=0](f(x+Δx,y)-f(x,y))/Δx≈(f(x+Δx)-f(x))/Δx

f(x+Δx)≈f(x)+f'(x)Δx

例:f(x)=e^x,求x=0的近似公式

e^(x+Δx)=e^x+e^x*Δx

x=0,将Δx=x

e^x=1+x

导数是线性变换

多变量函数的近似值

f(x+Δx,y+Δy)≈f(x,y)+∂f(x,y)/∂x*Δx+∂f(x,y)/∂y*Δy

令Δz=f(x+Δx,y+Δy)-f(x,y)

Δz≈∂f(x,y)/∂x*Δx+∂f(x,y)/∂y*Δy≈∂z/∂x*Δx+∂z/∂y*Δy

再多变量时Δz≈∂z/∂x*Δx+∂z/∂y*Δy+∂z/∂w*Δw

令∇z=(∂z/∂w,∂z/∂x,∂z/∂y),Δx=(Δw,Δx,Δy)

Δz=∇z*Δx=(∂z/∂w,∂z/∂x,∂z/∂y)*(Δw,Δx,Δy)

关于导数、偏导数的理解相关推荐

  1. 上随体导数的一些理解

    何谓"上随体导数"(upper-convected derivative ) 最近,老师让整理一下上随体导数的定义,并谈谈自己的理解.搜索后才发现中文几乎找不到上随体导数这个词,所 ...

  2. 对微分和导数的区别理解

    微分: 首先,dy/dx并不是一个商,它表示的是x的一个无穷小的增量dx和y对应的增量dy的函数关系: 从几何的角度来看,微分是在一个极小的局部用一个线段代替曲线,微分就是这个线段的函数,是将非线性函 ...

  3. 多元微积分(一)--导数与偏导数

    大家学习多元微积分,遇到的第一个难点想必就是偏导数,别问俺怎么知道的,因为俺当时也不会(小声).但是,现在会了,就来告诉大家这个偏导数究竟是什么东东. 1.导数 首先,偏导数,人家毕竟带着" ...

  4. 导数,偏导数,方向导数,梯度

    @梯度 梯度 为什么梯度是函数方向变化中最快的,梯度是矢量 为什么梯度是函数方向变化中最快的,梯度是矢量 从导数==>偏导数==>方向导数==>梯度由浅入深的分析梯度 提示:以下是本 ...

  5. 流体力学-----对物质导数的理解

    文章目录 前言 物质导数 公式推导 通俗理解 参考资料 前言 只是为方便学习,不做其他用途,参考知乎文章N-S方程篇2:物质导数 对流动模型:流体微元(Fluid Element)和有限控制体(Con ...

  6. 方向导数与梯度的实质理解

    https://www.zhihu.com/question/36301367 如何直观形象的理解方向导数与梯度以及它们之间的关系? 微信公众号:matongxue314 我们先来玩一个游戏,假如你在 ...

  7. 人工智能-高等数学之偏导数与梯度

    高等数学之偏导数与梯度 接着上一篇<人工智能-高等数学之微积分篇>,来学下一篇偏导数与梯度下降,在一元函数中,导数就是函数的变化率.对于二元函数研究它的"变化率",由于 ...

  8. 二元函数可微与可导的关系_如何理解多元函数可微与可偏导的关系?

    原标题:如何理解多元函数可微与可偏导的关系? 谈到多元函数可微与可偏导时,相信不少人头皮有点发麻.一元函数中,可微与可导是等价的,但是在多元函数中,可微与可偏导之间的关系就没那么简单了,这是为什么呢? ...

  9. 带着偏头痛学习偏导数

    本周屁事 偏头疼整得我怀疑人生 周五的时候收到Coursera的deadline通知 圆通的虚假派送真恶心人 整个个情人节没干别的,主要负责头疼!真疼,疼的怀疑人生.一度以为是找不到对象急的.介绍下我 ...

最新文章

  1. .NET重构—单元测试的代码重构
  2. Windows XP任务管理器内进程名详解
  3. LeetCode 669. Trim a Binary Search Tree修剪二叉搜索树 (C++)
  4. Spring AOP编程-aspectJ注解开发
  5. python 关键字大全_一日一技:用实例列举python中所有的关键字(01)
  6. [css] 你是怎么设计css sprites(精灵图)的?有哪些技巧?
  7. 《Effective Modern C++》翻译--条款4:了解怎样查看推导出的类型
  8. 只允许对最后一条记录进行修改
  9. C#LeetCode刷题之#219-存在重复元素 II​​​​​​​(Contains Duplicate II)
  10. DatabaseMetaData 获取mysql表和字段注释
  11. 【跃迁之路】【593天】程序员高效学习方法论探索系列(实验阶段350-2018.09.21)...
  12. gplv3协议可以商用吗_协议离婚以后,可以变更原离婚协议的内容吗?
  13. Yii2.0在GridView中下拉过滤筛选的实现
  14. 转︱机器学习算法线上部署方法
  15. asp.net中SqlDataReader使用时关闭数据库连接的问题(转)
  16. 应用文写作(超星尔雅)
  17. 右耳Python小作业--快递分拣
  18. 电脑照片太大怎么压缩?照片怎么缩小kb?
  19. 关于虚拟机访问网页证书错误的问题?
  20. terraform_有关使用terraform优化云成本的权威指南

热门文章

  1. 计算机vb2级知识点,2020年全国计算机二级VB复习知识点:VB编码规则
  2. 网页自动浏览.刷票.自动留言之登陆篇(VB)
  3. 基于java+jsp的酒店预订系统
  4. FlashPaper打印机未能正确安装的解决办法
  5. 数据库存储 IP 地址的几种方式
  6. 计算机视觉领域最全汇总
  7. php微博互粉源码,PHP实现微博的同步发送
  8. 安卓文字绘制和歌词器的简单实现
  9. GC433TR4模块性能超穿墙王SI4432无线收发模块
  10. python图书库存管理系统的需求分析_书店管理系统需求分析.doc