为何要“深”?
pluskid的博客 Deep Learning and Shallow Learning

Bengio Y. Learning deep architectures for AI. Foundations and trends® in Machine Learning, 2009


Deeper is Better?


模型有更多的参数会有更好的结果,这是毋庸置疑的。

深瘦的模型会比浅胖的模型有更好的表达能力。


Universality Theorem


虽然理论上单层网络可以表达任意的函数,但是实际上更深的结构在表达函数的能力更出色。

细节见 A visual proof that neural nets can compute any function


Do Deep Nets Really Need To Be Deep? (by Rich Caruana)


更多细节见 Rich Caruana

“Do Deep Nets Really Need to be Deep?”阅读笔记


参考文献


Home: http://speech.ee.ntu.edu.tw/~tlkagk/courses_ML17.html

A visual proof that neural nets can compute any function

Rich Caruana
Deep Learning: Theoretical Motivations (Yoshua Bengio)
Connections between physics and deep learning

Why Deep Learning Works: Perspectives from Theoretical
Chemistry

李宏毅机器学习课程11~~~为何要深?相关推荐

  1. 李宏毅机器学习课程---2、Regression - Case Study

    李宏毅机器学习课程---2.Regression - Case Study 一.总结 一句话总结: 分类讨论可能是比较好的找最佳函数的方法:如果 有这样的因素存在的话 模型不够好,可能是因素没有找全 ...

  2. 台大李宏毅机器学习课程

    [机器学习入门] 台大李宏毅机器学习课程,转载来自:https://blog.csdn.net/soulmeetliang/article/details/77461607 TOPIC CONTENT ...

  3. 李宏毅机器学习课程-Transfer Learning

    深度学习 -> 强化学习 ->迁移学习(杨强教授报告) 李宏毅机器学习课程-Transfer Learning 迁移学习-吴恩达 freeze 待处理的 理解深层神经网络中的迁移学习及Te ...

  4. 李宏毅机器学习课程12~~~半监督学习

    Semi-supervised Learning The distribution of the unlabeled data tell us something. Usually with some ...

  5. 李宏毅机器学习课程4~~~分类:概率生成模型

    分类问题用回归来解决? 当有右图所示的点时,这些点会大幅改变分类线的位置.这时候就会导致整体的回归结果变差.当把多分类当成回归问题,类别分别为1,2,3,4--,因为回归的问题是预测具体的值,这样定义 ...

  6. 李宏毅机器学习课程自测练习题

    暂停更新 Last Modified 2022.1.7 Fri 22:27 目录(计划包含以下内容): 简介 线性分类与感知机 数学基础 卷积神经网络 循环神经网络 自注意力机制 Transforme ...

  7. 李宏毅机器学习课程10~~~卷积神经网络

    卷积的意义 数字图像是一个二维的离散信号,对数字图像做卷积操作其实就是利用卷积核(卷积模板)在图像上滑动,将图像点上的像素灰度值与对应的卷积核上的数值相乘,然后将所有相乘后的值相加作为卷积核中间像素对 ...

  8. 李宏毅机器学习课程1~~~Introduction Regression

    机器学习介绍 机器学习就是要找一个函数. 机器学习的三大要素框架:训练集,函数集(模型集),损失函数集. 机器学习图谱 AI训练师的成长之路. 1. 梯度下降法的理解Gradient Descent ...

  9. 【李宏毅机器学习课程笔记】深度强化学习(五)—— Sparse Reward

    文章目录 Introduction Reward Shaping Curiosity Curriculum Learning Hierarchical Reinforcement Learning I ...

最新文章

  1. 基于小波变换的图像解压缩
  2. linux中系统调用和库函数的区别
  3. 图解python_图解Python深拷贝和浅拷贝
  4. ue4小白人骨骼定义_动画短片在UE4中的工作流程都有哪些?来看游戏建模师如何分析的...
  5. C#中不常见的运算符功能汇总
  6. java和c++的区别大吗_小自考本科含金量高吗?小自考和大自考有什么区别?
  7. oralce load的时候使用触发器会导致load慢吗_你真的了解性能压测中的SLA吗?
  8. 基础算法 —— 模拟思维
  9. 翻译: Keras 标准化:TensorFlow 2.0 中高级 API 指南
  10. 如何禁止用户删除计算机服务,怎样才能禁止别人删除我电脑中的文件?
  11. 使用include-what-you-use优化编译速度
  12. vue-cli安装了,却说vue不是命令解决方法
  13. COMSOL有限元仿真深度指南:为结构件添加预应变
  14. python鲜花水果商城毕业设计开题报告
  15. android设备连接电脑无需授权
  16. 小程序视频不显示进度条,且不能滑屏快进
  17. Android使用Github Actions持续集成并自动上传apk到蒲公英App内测分发平台(含证书密码脱敏)
  18. 【程序人生】IT界含金量高的证书
  19. SpringBoot + Vue 的物流仓库管理系统源码
  20. 每日新闻丨五方面推动云计算产业发展;字节跳动与澎湃合资成立视听科技

热门文章

  1. mysql出现can t_php运行提示Can't connect to MySQL server on 'localhost'的解决方法
  2. oracle连接数一直超出,Oracle超出最大連接數問題及解決(…
  3. [蓝桥杯][算法提高VIP]项链(dfs)
  4. 线段树位运算的三种操作(|,^,)
  5. python基础总结--- 列表、内置函数(4-5)
  6. VISIO2010界面介绍
  7. android后台自播放音乐,Android实现后台播放音乐(Service方式)
  8. ant文件放在ps的哪里_ant design vue按需导入icons
  9. 数学--数论--二次探测定理
  10. USACO Training Section 1.2 挤牛奶Milking Cows