台湾大学林轩田机器学习基石课程学习笔记1 -- The Learning Problem
红色石头的个人网站:redstonewill.com
最近在看NTU林轩田的《机器学习基石》课程,个人感觉讲的非常好。整个基石课程分成四个部分:
When Can Machine Learn?
Why Can Machine Learn?
How Can Machine Learn?
How Can Machine Learn Better?
每个部分由四节课组成,总共有16节课。那么,从这篇开始,我们将连续对这门课做课程笔记,共16篇,希望能对正在看这们课的童鞋有所帮助。下面开始第一节课的笔记:The Learning Problem。
一、What is Machine Learning
什么是“学习”?学习就是人类通过观察、积累经验,掌握某项技能或能力。就好像我们从小学习识别字母、认识汉字,就是学习的过程。而机器学习(Machine Learning),顾名思义,就是让机器(计算机)也能向人类一样,通过观察大量的数据和训练,发现事物规律,获得某种分析问题、解决问题的能力。
机器学习可以被定义为:Improving some performance measure with experence computed from data. 也就是机器从数据中总结经验,从数据中找出某种规律或者模型,并用它来解决实际问题。
什么情况下会使用机器学习来解决问题呢?其实,目前机器学习的应用非常广泛,基本上任何场合都能够看到它的身影。其应用场合大致可归纳为三个条件:
事物本身存在某种潜在规律
某些问题难以使用普通编程解决
有大量的数据样本可供使用
二、Applications of Machine Learning
机器学习在我们的衣、食、住、行、教育、娱乐等各个方面都有着广泛的应用,我们的生活处处都离不开机器学习。比如,打开购物网站,网站就会给我们自动推荐我们可能会喜欢的商品;电影频道会根据用户的浏览记录和观影记录,向不同用户推荐他们可能喜欢的电影等等,到处都有机器学习的影子。
三、Components of Machine Learning
本系列的课程对机器学习问题有一些基本的术语需要注意一下:
输入x
输出y
目标函数f,即最接近实际样本分布的规律
训练样本data
假设hypothesis,一个机器学习模型对应了很多不同的hypothesis,通过演算法A,选择一个最佳的hypothesis对应的函数称为矩g,g能最好地表示事物的内在规律,也是我们最终想要得到的模型表达式。
实际中,机器学习的流程图可以表示为:
对于理想的目标函数f,我们是不知道的,我们手上拿到的是一些训练样本D,假设是监督式学习,其中有输入x,也有输出y。机器学习的过程,就是根据先验知识选择模型,该模型对应的hypothesis set(用H表示),H中包含了许多不同的hypothesis,通过演算法A,在训练样本D上进行训练,选择出一个最好的hypothes,对应的函数表达式g就是我们最终要求的。一般情况下,g能最接近目标函数f,这样,机器学习的整个流程就完成了。
四、Machine Learning and Other Fields
与机器学习相关的领域有:
数据挖掘(Data Mining)
人工智能(Artificial Intelligence)
统计(Statistics)
其实,机器学习与这三个领域是相通的,基本类似,但也不完全一样。机器学习是这三个领域中的有力工具,而同时,这三个领域也是机器学习可以广泛应用的领域,总得来说,他们之间没有十分明确的界线。
五、总结
本节课主要介绍了什么是机器学习,什么样的场合下可以使用机器学习解决问题,然后用流程图的形式展示了机器学习的整个过程,最后把机器学习和数据挖掘、人工智能、统计这三个领域做个比较。本节课的内容主要是概述性的东西,比较简单,所以笔记也相对比较简略。
这里附上林轩田(Hsuan-Tien Lin)关于这门课的主页:
http://www.csie.ntu.edu.tw/~htlin/
注明:
文章中所有的图片均来自台湾大学林轩田《机器学习基石》课程。
关注公众号并输入关键字“jspdf”获得该笔记的pdf文件哦~
更多AI资源请关注公众号:红色石头的机器学习之路(ID:redstonewill)
台湾大学林轩田机器学习基石课程学习笔记1 -- The Learning Problem相关推荐
- 林轩田机器学习基石课程学习笔记1.The Learning Problem
Course Introduction 机器学习是一门理论与实践结合的学科,不能讲的太理论,这样就会无聊,不知道如何用在实际的问题上. 不能全讲机器学习的方法,这样的话在遇到实际问题时,不知道用那个方 ...
- 林轩田机器学习基石课程学习笔记1 -- The Learning Problem
来源 | AI 算法与图像处理 主要内容 What is Machine Learning Applications of Machine Learning Components of Machine ...
- 台湾大学林轩田机器学习基石课程学习笔记13 -- Hazard of Overfitting
红色石头的个人网站:redstonewill.com 上节课我们主要介绍了非线性分类模型,通过非线性变换,将非线性模型映射到另一个空间,转换为线性模型,再来进行分类,分析了非线性变换可能会使计算复杂度 ...
- 台湾大学林轩田机器学习基石课程学习 笔记资料汇总
笔记: 红色石头的专栏(写得非常好) 课后练习: 機器學習基石(Machine Learning Foundations) 机器学习基石 课后习题链接汇总 https://download.csdn. ...
- 台湾大学林轩田机器学习基石课程学习笔记15 -- Validation
红色石头的个人网站:redstonewill.com 上节课我们主要讲了为了避免overfitting,可以使用regularization方法来解决.在之前的EinEinE_{in}上加上一个reg ...
- 台湾大学林轩田机器学习基石课程学习笔记11 -- Linear Models for Classification
红色石头的个人网站:redstonewill.com 上一节课,我们介绍了Logistic Regression问题,建立cross-entropy error,并提出使用梯度下降算法gradient ...
- 台湾大学林轩田机器学习基石课程学习笔记10 -- Logistic Regression
红色石头的个人网站:redstonewill.com 上一节课,我们介绍了Linear Regression线性回归,以及用平方错误来寻找最佳的权重向量w,获得最好的线性预测.本节课将介绍Logist ...
- 台湾大学林轩田机器学习基石课程学习笔记8 -- Noise and Error
红色石头的个人网站:redstonewill.com 上一节课,我们主要介绍了VC Dimension的概念.如果Hypotheses set的VC Dimension是有限的,且有足够多N的资料,同 ...
- 台湾大学林轩田机器学习基石课程学习笔记7 -- The VC Dimension
红色石头的个人网站:redstonewill.com 前几节课着重介绍了机器能够学习的条件并做了详细的推导和解释.机器能够学习必须满足两个条件: 假设空间H的Size M是有限的,即当N足够大的时候, ...
最新文章
- Android---AlarmManager(全局定时器/闹钟)指定时长或以周期形式执行某项操作
- 源代码提交SOP(Git版)
- winform checkbox要点击两次_这个Winform的UI库也太全了!四十多个控件都在这一个项目里了...
- Atlas Control Toolkit更新发布V1.0.60914.0
- Python基础教程---读书笔记一
- 微信小程序 java通过 rawData 和 session_key 生成 signature 签名
- 分布式存储问题及解决方案
- Word to PDF Converter v3.0 算法分析及注册机
- 配置review board自动发送邮件内容中的URL
- win10 任务栏通知区图标不见了
- python你TM太皮了——区区30行代码就能记录键盘的一举一动
- DBCC CHECKDB用法 手工修复数据库
- java开发第一天该做些什么?
- 如何修理无线网络电视服务器,win7实现无线投屏到电视_网站服务器运行维护
- Unity游戏快速制作特效
- python 消息 推送服务器,从客户端发送字符串消息到服务器Python
- #关于新建的文本文档(记事本)没有后缀名txt的问题的解决方法
- unity3d学习之镜头耀斑
- seajs学习(6)----配置
- 逻辑Flask——Flask模板
热门文章
- 系统快捷键被谁占用? 查看工具
- 使用parted命令对硬盘进行操作
- HDU 5531 Rebuild
- 用ASP.NET 重绘TabControl代码
- 大家放松下吧,咱家先在首页呆会儿!
- Create Tables and Build inserts from Tables by using Mygeneration Templates(Sql Server)
- hdu-4510 小Q系列故事——为什么时光不能倒流(比赛被虐的一道水题)
- [JS 分析] 汽_车_之_家 JS 生成 CSS 伪元素 hs_kw44_configUS::before
- Hadoop视频教程6折 低达4.5折
- 【转】 MySQL索引类型一览 让MySQL高效运行起来 mysql索引注意事项