说明:本文是七月算法5月深度学习班第一次课听课笔记。只记录关键知识点,有些没具体展开。帮助复习用。文中使用了老师课件中的公式。

微积分

导数

定义
常用函数导数
导数法则
加法  乘法  除法  链式法则
一元函数与多元函数
一阶导   一元函数 f'(x) 
多元函数               
二阶导    一元函数f‘’(x)
    多元函数Hessian矩阵

泰勒级数

泰勒级数公式    一元版和多元版

一级导数=0  这一点可能为 平稳点、极值点、鞍点。如果二级导数>0,是极小值点;二级导数<0,是极大值点。二级导数=0,是鞍点。注意在多元函数中二级导数>0,就是指hession矩阵>0(正定矩阵)。

梯度下降

为了找到函数最小值,首先要求一阶导数。当原函数的导数不好求,或者不可求的时候选择梯度下降。
为什么是梯度下降?
在函数已知点 (xk,f(xk)) ,走一个方向 delta。怎么才能让函数最快上升呢?根据上面的泰勒级数公式,当  delta = 梯度方向的时候, 可以取到最大值,所以函数增长会最大。
当需要求函数最小值的时候,只要沿着负梯度方向就可以了。当然这里还有一个重要的参数是步长。

概率论

随机变量

离散型 分布式函数
连续型 累计分布函数概率密度函数

高斯分布

表达式   一元版   多元函数版
中心极限定理
多个(>=4)泊松分布的和是高斯分布
独立高斯变量相加=高斯分布

贝叶斯公式

贝叶斯公式用于推断一件事情发生的可能性。
通过 公式1和公式2推出公式3,进而得到公式4,贝叶斯公式。P(A|B)是后验概率,P(B)是一个确定的事件,P(A)是先验概率,P(B|A)是似然函数。
吸毒案例学习
注意:当先验概率很低的时候,即使似然函数有很高的值,结果也可能很低。

矩阵

特征向量与特征值

A为一个矩阵 ,X为一个向量,r为一个实数。如果 AX=rX。则X是A的特征向量,r是特征值。也就是说一个向量,经过矩阵A的变换之后,仍然和原向量共线。
矩阵所有特征值不同=> 特征向量线性无关

对称矩阵特征分解

PCA

对象                          操作       结果 
X                               协方差  =  Cx
Cx                             SVD   =     U(单位特征向量)
(U转置)   X                内积   =     Y 对(X做去相关操作)
Y                               协方差   =  Cy  对角阵,对角元素是X的特征值,按照从小到大排序
                                                                  与U中的列  特征向量正好 对应,形成特征向量与特征值
U[:,:k] X                      内积    =    降维后的矩阵

凸优化

一般有约束的优化问题

KKT条件

将约束转为无约束

凸优化问题

无约束问题求解--------SGD
有约束优化问题  --------------拉格朗日乘子--------无约束问题-----------KKT 求解

深度学习第一次课-数学相关推荐

  1. 保证为正数 深度学习_深度学习:让数学课堂学习真正发生

    在21世纪核心素养中,深度学习能力是公民必须具备的生活和工作能力,发展深度学习是当代学习科学的重要举措,是深度加工知识信息.提高学习效率的有效途径.深度学习也称深层学习,是美国学者Ference Ma ...

  2. 吴恩达老师深度学习视频课笔记:总结

    吴恩达老师深度学习视频课网址为:https://mooc.study.163.com/smartSpec/detail/1001319001.htm/?utm_source=weibo.com& ...

  3. 吴恩达深度学习网课小结

    Coursera上吴恩达的深度学习网课,很适合那些想了解和学习深度学习的人来入门. 这个深度学习的专项网课共包含了五门课,包含了神经网络.卷积神经网络(CNN).循环神经网络(RNN).长短期记忆网络 ...

  4. 吴恩达老师深度学习视频课笔记:逻辑回归公式推导及C++实现

    逻辑回归(Logistic Regression)是一个二分分类算法.逻辑回归的目标是最小化其预测与训练数据之间的误差.为了训练逻辑回归模型中的参数w和b,需要定义一个成本函数(cost functi ...

  5. [深度学习基础] 深度学习基础及数学原理

    图像分类 (image classification) 问题是指, 假设给定一系列离散的类别(categories)(如猫, 狗, 飞机, 货车, ...), 对于给定的图像, 从这些类别中赋予一个作 ...

  6. 深度学习背后的数学_深度学习背后的简单数学

    深度学习背后的数学 Deep learning is one of the most important pillars in machine learning models. It is based ...

  7. 趣图:深度学习背后的数学 vs import keras

    (给Python开发者加星标,提升Python技能) 深度学习背后的数学 vs import keras ↓↓↓ 往期趣图(点击下方图片可跳转阅读) 关注「程序员的那些事」加星标,每天看趣图 (商务合 ...

  8. 深度学习中的数学-线性代数

    深度学习中的数学-线性代数 1 矩阵和向量相乘 1.1 标准乘积 1.2 元素对应乘积 2 线性相关和生成子空间 3 特征分解 4 奇异值分解 推荐书目 参考 1 矩阵和向量相乘 1.1 标准乘积 如 ...

  9. LeCun亲授的深度学习入门课:从飞行器的发明到卷积神经网络

    Root 编译整理 量子位 出品 | 公众号 QbitAI 深度学习和人脑有什么关系?计算机是如何识别各种物体的?我们怎样构建人工大脑? 这是深度学习入门者绕不过的几个问题.很幸运,这里有位大牛很乐意 ...

最新文章

  1. js关于正则的前后关联约束(前后预查)
  2. SCRUM的三个工件
  3. 以下可以采用python语言保留字的是-以下选项中,不是Python语言保留字的是_学小易找答案...
  4. VS切换到按F5不需要按Fn键的快捷键模式
  5. Oracle中的in 和 not in
  6. mysql也能注册到eureka_为什么我的服务提供者和消费者都注册不到eureka注册中心?...
  7. 如何以10倍速加速Apache Xalan的XPath处理器
  8. C++ Variadic Templates(可变参数模板)
  9. 一文详解:字节面试官必问的Mysql锁机制
  10. 计算机二级c语言填空题答案唯一吗,计算机二级C语言上机填空题及答案.doc
  11. 【LeetCode】Maximum Product Subarray 求连续子数组使其乘积最大
  12. jdk Double类具体实现
  13. 张小龙:微信产品观(下)
  14. Android不透明度16进制值
  15. 吉他入门教程——记忆音阶的两种方法
  16. NOI2015 小园丁和老司机
  17. CTF逆向(Reverse)知识点总结
  18. 无线网卡无法获取dhcp服务器,无线网络无法获取网络IP地址
  19. HTML5游戏 看你有多“色” 开发
  20. 【算法设计与分析】经典常考三十三道例题AC代码

热门文章

  1. [转载][QT][SQL]sql学习记录3_sqlite之update delete like
  2. linux 新建用户、用户组 以及为新用户分配权限
  3. inline,block,inline-block的区别
  4. 如何运行ruby代码
  5. 利用CSS、JavaScript及Ajax实现图片预加载的三大方法及优缺点分析
  6. “四方定理”--蓝桥杯
  7. 导致Android手机崩溃的壁纸,使用错误的壁纸会使你的Android手机崩溃
  8. 深入浅出JVM-内存模型
  9. Android 地图搜索商家,检索关键字(高德地图,百度地图),地址搜索
  10. 阿里云轻应用服务器 宝塔面板 mongodb 配置外网连接 其二 配置账号密码