红色石头的个人网站:redstonewill.com

最近在看NTU林轩田的《机器学习基石》课程,个人感觉讲的非常好。整个基石课程分成四个部分:

  • When Can Machine Learn?

  • Why Can Machine Learn?

  • How Can Machine Learn?

  • How Can Machine Learn Better?

每个部分由四节课组成,总共有16节课。那么,从这篇开始,我们将连续对这门课做课程笔记,共16篇,希望能对正在看这们课的童鞋有所帮助。下面开始第一节课的笔记:The Learning Problem。

一、What is Machine Learning

什么是“学习”?学习就是人类通过观察、积累经验,掌握某项技能或能力。就好像我们从小学习识别字母、认识汉字,就是学习的过程。而机器学习(Machine Learning),顾名思义,就是让机器(计算机)也能向人类一样,通过观察大量的数据和训练,发现事物规律,获得某种分析问题、解决问题的能力。

机器学习可以被定义为:Improving some performance measure with experence computed from data. 也就是机器从数据中总结经验,从数据中找出某种规律或者模型,并用它来解决实际问题。

什么情况下会使用机器学习来解决问题呢?其实,目前机器学习的应用非常广泛,基本上任何场合都能够看到它的身影。其应用场合大致可归纳为三个条件:

  • 事物本身存在某种潜在规律

  • 某些问题难以使用普通编程解决

  • 有大量的数据样本可供使用

二、Applications of Machine Learning

机器学习在我们的衣、食、住、行、教育、娱乐等各个方面都有着广泛的应用,我们的生活处处都离不开机器学习。比如,打开购物网站,网站就会给我们自动推荐我们可能会喜欢的商品;电影频道会根据用户的浏览记录和观影记录,向不同用户推荐他们可能喜欢的电影等等,到处都有机器学习的影子。

三、Components of Machine Learning

本系列的课程对机器学习问题有一些基本的术语需要注意一下:

  • 输入x

  • 输出y

  • 目标函数f,即最接近实际样本分布的规律

  • 训练样本data

  • 假设hypothesis,一个机器学习模型对应了很多不同的hypothesis,通过演算法A,选择一个最佳的hypothesis对应的函数称为矩g,g能最好地表示事物的内在规律,也是我们最终想要得到的模型表达式。

实际中,机器学习的流程图可以表示为:

对于理想的目标函数f,我们是不知道的,我们手上拿到的是一些训练样本D,假设是监督式学习,其中有输入x,也有输出y。机器学习的过程,就是根据先验知识选择模型,该模型对应的hypothesis set(用H表示),H中包含了许多不同的hypothesis,通过演算法A,在训练样本D上进行训练,选择出一个最好的hypothes,对应的函数表达式g就是我们最终要求的。一般情况下,g能最接近目标函数f,这样,机器学习的整个流程就完成了。

四、Machine Learning and Other Fields

与机器学习相关的领域有:

  • 数据挖掘(Data Mining)

  • 人工智能(Artificial Intelligence)

  • 统计(Statistics)

其实,机器学习与这三个领域是相通的,基本类似,但也不完全一样。机器学习是这三个领域中的有力工具,而同时,这三个领域也是机器学习可以广泛应用的领域,总得来说,他们之间没有十分明确的界线。

五、总结

本节课主要介绍了什么是机器学习,什么样的场合下可以使用机器学习解决问题,然后用流程图的形式展示了机器学习的整个过程,最后把机器学习和数据挖掘、人工智能、统计这三个领域做个比较。本节课的内容主要是概述性的东西,比较简单,所以笔记也相对比较简略。

这里附上林轩田(Hsuan-Tien Lin)关于这门课的主页:
http://www.csie.ntu.edu.tw/~htlin/

注明:

文章中所有的图片均来自台湾大学林轩田《机器学习基石》课程。

关注公众号并输入关键字“jspdf”获得该笔记的pdf文件哦~

更多AI资源请关注公众号:红色石头的机器学习之路(ID:redstonewill)

台湾大学林轩田机器学习基石课程学习笔记1 -- The Learning Problem相关推荐

  1. 林轩田机器学习基石课程学习笔记1.The Learning Problem

    Course Introduction 机器学习是一门理论与实践结合的学科,不能讲的太理论,这样就会无聊,不知道如何用在实际的问题上. 不能全讲机器学习的方法,这样的话在遇到实际问题时,不知道用那个方 ...

  2. 林轩田机器学习基石课程学习笔记1 -- The Learning Problem

    来源 | AI 算法与图像处理 主要内容 What is Machine Learning Applications of Machine Learning Components of Machine ...

  3. 台湾大学林轩田机器学习基石课程学习笔记13 -- Hazard of Overfitting

    红色石头的个人网站:redstonewill.com 上节课我们主要介绍了非线性分类模型,通过非线性变换,将非线性模型映射到另一个空间,转换为线性模型,再来进行分类,分析了非线性变换可能会使计算复杂度 ...

  4. 台湾大学林轩田机器学习基石课程学习 笔记资料汇总

    笔记: 红色石头的专栏(写得非常好) 课后练习: 機器學習基石(Machine Learning Foundations) 机器学习基石 课后习题链接汇总 https://download.csdn. ...

  5. 台湾大学林轩田机器学习基石课程学习笔记15 -- Validation

    红色石头的个人网站:redstonewill.com 上节课我们主要讲了为了避免overfitting,可以使用regularization方法来解决.在之前的EinEinE_{in}上加上一个reg ...

  6. 台湾大学林轩田机器学习基石课程学习笔记11 -- Linear Models for Classification

    红色石头的个人网站:redstonewill.com 上一节课,我们介绍了Logistic Regression问题,建立cross-entropy error,并提出使用梯度下降算法gradient ...

  7. 台湾大学林轩田机器学习基石课程学习笔记10 -- Logistic Regression

    红色石头的个人网站:redstonewill.com 上一节课,我们介绍了Linear Regression线性回归,以及用平方错误来寻找最佳的权重向量w,获得最好的线性预测.本节课将介绍Logist ...

  8. 台湾大学林轩田机器学习基石课程学习笔记8 -- Noise and Error

    红色石头的个人网站:redstonewill.com 上一节课,我们主要介绍了VC Dimension的概念.如果Hypotheses set的VC Dimension是有限的,且有足够多N的资料,同 ...

  9. 台湾大学林轩田机器学习基石课程学习笔记7 -- The VC Dimension

    红色石头的个人网站:redstonewill.com 前几节课着重介绍了机器能够学习的条件并做了详细的推导和解释.机器能够学习必须满足两个条件: 假设空间H的Size M是有限的,即当N足够大的时候, ...

最新文章

  1. Android---AlarmManager(全局定时器/闹钟)指定时长或以周期形式执行某项操作
  2. 源代码提交SOP(Git版)
  3. winform checkbox要点击两次_这个Winform的UI库也太全了!四十多个控件都在这一个项目里了...
  4. Atlas Control Toolkit更新发布V1.0.60914.0
  5. Python基础教程---读书笔记一
  6. 微信小程序 java通过 rawData 和 session_key 生成 signature 签名
  7. 分布式存储问题及解决方案
  8. Word to PDF Converter v3.0 算法分析及注册机
  9. 配置review board自动发送邮件内容中的URL
  10. win10 任务栏通知区图标不见了
  11. python你TM太皮了——区区30行代码就能记录键盘的一举一动
  12. DBCC CHECKDB用法 手工修复数据库
  13. java开发第一天该做些什么?
  14. 如何修理无线网络电视服务器,win7实现无线投屏到电视_网站服务器运行维护
  15. Unity游戏快速制作特效
  16. python 消息 推送服务器,从客户端发送字符串消息到服务器Python
  17. #关于新建的文本文档(记事本)没有后缀名txt的问题的解决方法
  18. unity3d学习之镜头耀斑
  19. seajs学习(6)----配置
  20. 逻辑Flask——Flask模板

热门文章

  1. 系统快捷键被谁占用? 查看工具
  2. 使用parted命令对硬盘进行操作
  3. HDU 5531 Rebuild
  4. 用ASP.NET 重绘TabControl代码
  5. 大家放松下吧,咱家先在首页呆会儿!
  6. Create Tables and Build inserts from Tables by using Mygeneration Templates(Sql Server)
  7. hdu-4510 小Q系列故事——为什么时光不能倒流(比赛被虐的一道水题)
  8. [JS 分析] 汽_车_之_家 JS 生成 CSS 伪元素 hs_kw44_configUS::before
  9. Hadoop视频教程6折 低达4.5折
  10. 【转】 MySQL索引类型一览 让MySQL高效运行起来 mysql索引注意事项