Lecture 01 - The Learning Problem

  • When Can Machine Learn ?
  • Why Can Machine Learn ?
  • How Can Machine Learn ?
  • How Can Machine Learn Better ?

What is Machine Learning

什么是“学习”?学习就是人类通过观察、积累经验,掌握某项技能或能力。就好像我们从小学习识别字母、认识汉字,就是学习的过程。而 机器学习(Machine Learning),顾名思义,就是让机器(计算机)也能向人类一样,通过观察大量的数据和训练,发现事物规律,获得某种分析问题、解决问题的能力。

机器学习可以被定义为:Improving some performance measure with experence computed from data. 也就是机器从数据中总结经验,从数据中找出某种规律或者模型,并用它来解决实际问题。

什么情况下会使用机器学习来解决问题呢?其实,目前机器学习的应用非常广泛,基本上任何场合都能够看到它的身影。其应用场合大致可归纳为三个条件:

  • 事物本身存在某种潜在规律。
  • 某些问题难以使用普通编程解决。
  • 有大量的数据样本可供使用。

Applications of Machine Learning

机器学习在我们的 教育娱乐 等各个方面都有着广泛的应用,我们的生活处处都离不开机器学习。比如,打开购物网站,网站就会给我们自动推荐我们可能会喜欢的商品;电影频道会根据用户的浏览记录和观影记录,向不同用户推荐他们可能喜欢的电影等等,到处都有机器学习的影子。

Components of Machine Learning

本系列的课程对机器学习问题有一些基本的术语需要注意一下:

  • 输入 xx{x}。
  • 输出 yy{y}。
  • 目标函数 ff{f} ,即最接近实际样本分布的规律。
  • 训练样本 datadata{data} 。
  • 假设 hypothesishypothesis{hypothesis} ,一个机器学习模型对应了很多不同的 hypothesishypothesis{hypothesis} ,通过演算法 AA{A} ,选择一个最佳的 hypothesishypothesis{hypothesis} 对应的函数称为 gg{g} ,gg{g} 能最好地表示事物的内在规律,也是我们最终想要得到的模型表达式。

对于理想的目标函数 ff{f} ,我们是不知道的,我们手上拿到的是一些训练样本 DD{D} ,假设是监督式学习,其中有输入 xx{x} ,也有输出 yy{y} 。机器学习的过程,就是根据先验知识选择模型,该模型对应的 hypothesis sethypothesisset{hypothesis\ set}(用 HH{H} 表示),HH{H} 中包含了许多不同的 hypothesishypothesis{hypothesis} ,通过演算法 AA{A} ,在训练样本 DD{D} 上进行训练,选择出一个最好的 hypotheshypothes{hypothes} ,对应的函数表达式 gg{g} 就是我们最终要求的。一般情况下, gg{g} 能最接近目标函数 ff{f} ,这样,机器学习的整个流程就完成了。

Machine Learning and Other Fields

与机器学习相关的领域有:

  • 数据挖掘(Data Mining)
  • 人工智能(Artificial Intelligence)
  • 统计(Statistics)

其实,机器学习与这三个领域是相通的,基本类似,但也不完全一样。机器学习是这三个领域中的有力工具,而同时,这三个领域也是机器学习可以广泛应用的领域,总得来说,他们之间没有十分明确的界线。

总结

本节课主要介绍了什么是机器学习,什么样的场合下可以使用机器学习解决问题,然后用流程图的形式展示了机器学习的整个过程,最后把机器学习和数据挖掘、人工智能、统计这三个领域做个比较。

参考

  1. 台湾大学林轩田机器学习基石课程学习笔记1 – The Learning Problem

机器学习基石-林轩田-第一周笔记相关推荐

  1. 【机器学习】机器学习基石-林轩田-2-Learning to Answer Yes_No

    机器学习基石-林轩田-2-Learning to Answer Yes_No 本节内容 引例 A Simple Hypothesis Set: Perceptron Perceptron Learni ...

  2. 机器学习基石-林轩田 Lecture 3:Types of Learning

    复习 这个是是非题(其实就是一个二元分类器) 信用卡的是否分发. 电子邮件是否是垃圾邮件 病人是否生病 广告是否会赚钱 这个学生是否能够答对这一题 机器学习种类 多类机器学习 把你投入的硬币分类(1c ...

  3. 机器学习基石 机器学习技法 林轩田 课件 ppt

    下载地址:https://www.csie.ntu.edu.tw/~htlin/mooc/ 这是林轩田在台大的个人网页,两种课的课件都有 Machine Learning Foundations Ma ...

  4. 机器学习基石(林軒田)笔记之十二

    Nonlinear Transformation(非线性转换) 回顾 在第十一讲中我们介绍了如何通过(logistic)回归来处理二分类问题,以及如何通过OVA/OVO分解来解决多分类问题. Quad ...

  5. 机器学习基石(林軒田)笔记之十三

    Hazard of Overfitting(过拟合的危害) 回顾 上一讲中我们学习了(非线性转换) What is Overfitting? 什么是过拟合? 1.假设输入空间为一维的,共有五个样本点的 ...

  6. 林轩田机器学习基石(Machine Learning Foundations)笔记(一)

    要求两周之内看完林轩田机器学习基石和技法,速度是要的,但是感觉看得太快我会不久就会忘记.因此记录一下梗概,顺便写写看视频时解决的不懂的地方(有种思想就是把知识传播给更多人,有时候就是靠大佬们善意的一句 ...

  7. 台湾大学林轩田机器学习基石课程学习笔记1 -- The Learning Problem

    红色石头的个人网站:redstonewill.com 最近在看NTU林轩田的<机器学习基石>课程,个人感觉讲的非常好.整个基石课程分成四个部分: When Can Machine Lear ...

  8. 台湾大学林轩田机器学习基石课程学习笔记15 -- Validation

    红色石头的个人网站:redstonewill.com 上节课我们主要讲了为了避免overfitting,可以使用regularization方法来解决.在之前的EinEinE_{in}上加上一个reg ...

  9. 台湾大学林轩田机器学习基石课程学习笔记13 -- Hazard of Overfitting

    红色石头的个人网站:redstonewill.com 上节课我们主要介绍了非线性分类模型,通过非线性变换,将非线性模型映射到另一个空间,转换为线性模型,再来进行分类,分析了非线性变换可能会使计算复杂度 ...

  10. 台湾大学林轩田机器学习基石课程学习笔记11 -- Linear Models for Classification

    红色石头的个人网站:redstonewill.com 上一节课,我们介绍了Logistic Regression问题,建立cross-entropy error,并提出使用梯度下降算法gradient ...

最新文章

  1. PCIE 硬件接口那点屁事
  2. mac 配置c语言环境,C语言学习笔记————–MAC下配置GTK+环境
  3. 为什么我们使用Nginx而不是Apache?
  4. ARTS打卡计划第六周
  5. php获取当前周得周一_PHP怎样获得最近一个周一和上周一的日期?
  6. FileItem类的常用方法
  7. Android 蓝牙技术 实现终端间数据传输
  8. Android4.0源码编译方法以及错误解决方案
  9. 笔记本电脑(PC)序列号查询
  10. biosrecovery什么意思_卡刷和线刷手机什么意思 Recovery使用方法
  11. Excel——输入身份证号后三位显示为0的问题
  12. macbook air适合学java,神舟7月9日发轻薄笔记本新品 比MacBook Air还要薄?
  13. 程序的优化 文字的减法
  14. android极光推送 小米,极光推送- 小米厂商通道集成指南 - 极光文档
  15. 破解excel工作表保护
  16. java开发对学位证_您需要软件学位才能成为成功的开发人员吗
  17. flink实战--水印(watermark)终极总结
  18. etcd http API
  19. net开发过程中,错误集锦
  20. 2021年中国中华遗嘱库义工志愿者区域分布、职业分布、举办公益普法讲座次数、自我教育培训次数、人次及占比[图]

热门文章

  1. 确定权重的方法-主成分分析
  2. WIN7 Activation,完美激活Windows 7,开机无字符,无OEM信息
  3. mysql脚本 ip数据库_纯真IP数据库镜像及sql脚本同步更新
  4. 无法远程桌面netmeeting
  5. OCX控件注册及无法注册的原因总结
  6. 小学计算机集体听课评课,小学语文听课笔记:教师集体听评课活动
  7. 网络编程练手小项目---英英词典
  8. IoTP2PGate 两台物联网设备点对点通信快速实现方案
  9. Django中文文档-The Django Book
  10. intellij idea编辑器好看炫酷主题配色方案推荐