李宏毅老师《深度学习》课程开始前两节课就是介绍机器学习的一些基本概念

文章目录

  • Marchine learning
  • Training steps
  • Structured Learning
  • overfitting
  • mismatch

Marchine learning

M a c h i n e l e a r n i n g ≈ L o o k i n g f o r F u n c t i o n Machine\ learning \approx Looking for Function Machine learning≈LookingforFunction
机器学习相当于是寻找输入输出对应的函数(model)

Training steps

step1: the function with unknown parameters

step2: define Loss from training data
Loss: how good a set of values is.
损失函数的定义: L = 1 N ∑ n e n L=\frac{1}{N}\sum_{n}e_n L=N1​∑n​en​
e = ∣ y − y ^ ∣ e=|y-\hat{y}| e=∣y−y^​∣ M A E MAE MAE即mean absolute error
e = ( y − y ^ ) 2 e=(y-\hat{y})^2 e=(y−y^​)2 M S E MSE MSE即mean square error

当 y y y和 y ^ \hat{y} y^​都是概率分布时,可能会选择交叉熵 C r o s s e n t r o p y Cross\ entropy Cross entropy作为损失函数

step3: optimization
w ∗ , b ∗ = a r g min ⁡ w , b L w^*,b^*=arg \min_{w,b} L w∗,b∗=argminw,b​L
优化方法有gradient descent

Structured Learning

S t r u c t u r e d L e a r n i n g ≈ c r e a t e s t h w i t h s t r u c t u r e ( i m a g e , d o c u m m e n t ) Structured\ Learning \approx create\ sth\ with\ structure(image, documment) Structured Learning≈create sth with structure(image,documment)

overfitting


当训练集上的loss小,测试集上的loss大时,才是过拟合

解决overfitting的方法:

  1. more training data(data augmentation)
    根据自己对于问题的理解,创造更多的数据
  2. constrained model
    根据问题给模型更多的限制
    比如less parameters、less features、early stopping、regularization、dropout

    在选择模型的时候应该综合训练集和测试集的误差来进行选择。

mismatch

Your traing and testing data have different distributions.

李宏毅老师的台湾腔真的好听啦~~

《深度学习》学习笔记(一)相关推荐

  1. 【web编程技术学习笔记】因特网与万维网简介

    目录 Client客户端 Server服务器端 TCP/IP五层协议 IP 查看IP地址的的两种方法 TCP URL 样式一 样式二 DNS URL&DNS HTTP 与因特网有关的组织 IE ...

  2. 程序员编程技术学习笔记

    程序员编程技术学习笔记     看july的博客也有好久了,一直没能好好整理一下自己的学习笔记,开了博客之后更加愿意好好整理一番了.其中不免有些内容在july那里可以找到原文,但是更多的加入了我个人的 ...

  3. JAVA 网络编程技术学习笔记

    目录 一.网络编程基本概念(了解) 1.1 计算机网络 1.2 网络通信协议 1.2.1什么是网络通信协议 1.2.2 OSI七层协议模型 1.2.3网络协议的分层 1.3数据的封装和解封 1.4 I ...

  4. 《ASP.NET MVC4 WEB编程》学习笔记------Web API 续

    目录 ASP.NET WEB API的出现缘由 ASP.NET WEB API的强大功能 ASP.NET WEB API的出现缘由 随着UI AJAX 请求适量的增加,ASP.NET MVC基于Jso ...

  5. java网络编程技术学习笔记(b站【狂神说Java】网络编程实战讲解)

    b站视频链接:[狂神说Java]网络编程实战讲解 文章目录 网络编程 1.1.概述 1.2.网络通信的要素 1.3.IP 1.4.端口 1.5.通信协议 1.6.TCP 文件发送 1.7.UDP 1. ...

  6. SpringBoot整合第三方技术学习笔记(自用)

    SpringBoot整合第三方技术学习笔记 搬运黑马视频配套笔记 KF-4.数据层解决方案 KF-4-1.SQL 回忆一下之前做SSMP整合的时候数据层解决方案涉及到了哪些技术?MySQL数据库与My ...

  7. java mvc框架代码_JAVA技术学习笔记:SpringMVC框架(内附入门程序开发代码)

    原标题:JAVA技术学习笔记:SpringMVC框架(内附入门程序开发代码) JavaEE体系结构包括四层,从上到下分别是应用层.Web层.业务层.持久层.Struts和SpringMVC是Web层的 ...

  8. ssm 转发请求_千呼万唤!阿里内部终于把这份SSM框架技术学习笔记分享出来了...

    SSM SSM(Spring+SpringMVC+MyBatis)框架集由Spring.MyBatis两个开源框架整合而成(SpringMVC是Spring中的部分内容).常作为数据源较简单的web项 ...

  9. 【C#编程基础学习笔记】6---变量的命名

    2013/7/24 技术qq交流群:JavaDream:251572072  教程下载,在线交流:创梦IT社区:www.credream.com [C#编程基础学习笔记]6---变量的命名 ----- ...

  10. 【C#编程基础学习笔记】4---Convert类型转换

    2013/7/24 技术qq交流群:JavaDream:251572072  教程下载,在线交流:创梦IT社区:www.credream.com [C#编程基础学习笔记]4---Convert类型转换 ...

最新文章

  1. Web测试容易忽略的地方
  2. datax导入MySQL报错_导入MySQL方法对比
  3. 【渝粤题库】陕西师范大学600002 物理化学(下) 作业(专升本)
  4. 引入的html设置utf-8,如何为default.html将字符编码设置为UTF-8?
  5. 你会先写PRD,还是先画原型?
  6. 英国央行行长:当前的加密货币不太可能取代法定货币
  7. 自动驾驶软件开发人才现状_浅析自动驾驶的重要一环:感知系统发展现状与方向...
  8. Linux 怎么重启 mysql
  9. 免费且高质量的知识有的是,你只是不知道怎么找到它们!
  10. presumably用法
  11. beetl模板使用场景_Beetl模板引擎入门教程
  12. Redis_21_RedisCluster集群版搭建和SpringBoot的使用(实践开发类)
  13. 想长胖的人看过来,几招教你变胖|猎人营
  14. Jenkins修改Job工作空间、修改日志路径
  15. ArcGIS Pro 专题图制作
  16. batchsize和数据量设置比例_1. 项目涉及技术
  17. 微信小程序 星级评分 (带小数的评分/半星)
  18. 易车上面可以买车吗?
  19. html text-decoration,text-decoration 属性
  20. 【邢不行|量化小讲堂系列10-Python量化入门】量化投资中如何处理复权、除权问题

热门文章

  1. Kali学习 | 无线渗透:7.9 Arpspoof工具
  2. Arduino mega2560蓝牙遥控小车简介
  3. TensorFlow中用深度学习修复图像
  4. 现在为什么很多企业都在使用终端安全管理系统?有什么好处...
  5. securecrt下传输大文件
  6. 聚丙烯酸(PAA)修饰纳米Fe3O4四氧化三铁粒子|CNTs/Fe3O4/TiO2纳米复合材料(齐岳)
  7. Java 知识点整理-7.StringBuffer类+冒泡排序+选择排序+二分法+Arrays类+基本数据类型的包装类
  8. SSM+医保业财一体化管理系统 毕业设计-附源码151023
  9. parsec(The parsec benchmark suit )使用教程
  10. 友盟+高吞吐、极速高并发智能推送服务,赋能值得买科技的精准化用户运营