《机器学习基石》课程笔记(1)
什么是机器学习
什么是学习?学习是人类通过观察世界积累经验进而获得相应技能的过程。而机器学习则是机器(计算机)通过计算数据,像人类一样积累经验并获得技能的过程。
机器学习更一般化的定义是Improving some performance measuer with experience computed from data.也就是机器通过计算的手段,利用积累的经验改善系统的性能。比如,让机器去学习股票数据以获得更多的投资收益。
机器学习的本质
并不是每个问题都需要机器学习来解决。事实上,有些问题在不使用机器学习的时候会取得更好的效果。那么,我们如何判断是否需要使用机器学习解决问题呢?首先,要存在一些可以被学习的潜在模式(underlying pattern)或规则,也就是说可以提升系统性能;其次,那些潜在模式或规则不能通过编程实现;最后,要有与模式或规则相关的数据,用来作为机器学习算法的输入。
基础符号定义
- 输入x∈Xx\in X:机器学习的输入
- 输出y∈Yy\in Y:我们想要机器学习告诉我们的答案,也就是机器学习的输出
- 目标函数f:X→Yf:X \rightarrow Y:我们想要学但是又不知道的模式或规律
- 数据⇔\Leftrightarrow训练样本:D={(x1,y1),(x2,y2),...,(xn,yn)}D=\{(x_1,y_1),(x_2,y_2),...,(x_n,y_n)\}
- 假说⇔\Leftrightarrow显著的性能提升:g:X→Yg:X\rightarrow Y,函数gg就是机器学到的东西,是ff的近似
机器学习的流程
从数据(与目标函数f:X→Yf:X\rightarrow Y有关)和假设集合HH出发,机器学习算法AA要算出一个函数gg,这个函数gg要接近于目标函数ff。其中假设集合HH和学习算法AA被称为机器学习模型。根据机器学习的流程,可以得到机器学习更具体的定义:use data to compute hypothesis g that approximates target f.即通过数据计算出一个近似于目标函数ff的假设gg。
机器学习和相关领域的关系
机器学习与数据挖掘
- 机器学习:通过数据计算出一个接近近似于目标函数ff的假设gg
- 数据挖掘:通过(大量的)数据找到一些有趣或有用的性质
- 如果“有趣的性质”就是直接找出一个假设gg,那么机器学习=数据挖掘
- 如果“有趣的性质”和假设gg相关,那么机器学习和数据挖掘相辅相成
- 传统上的数据挖掘常常关注于在大规模数据上的运算效率
机器学习与人工智能
- 机器学习:通过数据计算出一个接近近似于目标函数ff的假设gg
- 人工智能:计算某些东西,有一些聪明的表现
- 机器学习是实现人工智能的一种方法
- 比如下棋,传统人工智能使用一种叫博弈树(game tree)的方法,而使用机器学习的人工智能则“从棋盘数据中学习”。
机器学习与统计学
- 机器学习:通过数据计算出一个接近近似于目标函数ff的假设gg
- 统计学:使用数据做一些我们之前不知道的推论
- 假设gg是一个推论的结果,而目标函数f<script type="math/tex" id="MathJax-Element-29">f</script>则是我们不知道的东西,从这个角度来说,统计是实现机器学习的方法
- 传统的统计学常常关注于由数学推导得出的结果,而机器学习更关注于计算
- 统计学为机器学习提供很多游泳的方法和工具
《机器学习基石》课程笔记(1)相关推荐
- 机器学习 | 台大林轩田机器学习基石课程笔记12 --- Nonlinear Transformation
课程主页 课程视频和PPT 上一节课,我们介绍了分类问题的三种线性模型,可以用来解决binary classification和multiclass classification问题.本节课主要介绍非 ...
- 机器学习 | 台大林轩田机器学习基石课程笔记3 --- Types of Learning
课程主页 课程视频和PPT 上节课我们主要介绍了解决线性分类问题的一个简单的方法:PLA.PLA能够在平面中选择一条直线将样本数据完全正确分类(前提数据是线性可分的,在高维空间中,可以用一个超平面完全 ...
- 林轩田机器学习基石课程笔记1 -The Learing Problem
一.什么是机器学习 1.什么是"学习"? 机器学习(Machine Learning),顾名思义,就是让机器(计算机)也能向人类一样,通过观察大量的数据和训练,发现事物规律,获得某 ...
- 台湾大学林轩田机器学习基石课程学习笔记13 -- Hazard of Overfitting
红色石头的个人网站:redstonewill.com 上节课我们主要介绍了非线性分类模型,通过非线性变换,将非线性模型映射到另一个空间,转换为线性模型,再来进行分类,分析了非线性变换可能会使计算复杂度 ...
- 台大机器学习基石学习笔记
台大机器学习基石学习笔记 标签(空格分隔): 机器学习 目录 台大机器学习基石学习笔记 目录 Lecture 1 The Learning Problem Course Introduction Wh ...
- 台湾大学林轩田教授机器学习基石课程理解及python实现----PLA
最近在班主任的带领下,开始观看台湾大学林轩田教授的机器学习基石课程,虽然吧,台湾人,汉语说得蛮6,但是还是听着怪怪的,不过内容非常值得刚刚入门的机器学习 小白学习,话不多说,直接进入正题. 1.基本介 ...
- 台湾大学林轩田机器学习基石课程学习笔记1 -- The Learning Problem
红色石头的个人网站:redstonewill.com 最近在看NTU林轩田的<机器学习基石>课程,个人感觉讲的非常好.整个基石课程分成四个部分: When Can Machine Lear ...
- 台湾大学林轩田机器学习基石课程学习笔记15 -- Validation
红色石头的个人网站:redstonewill.com 上节课我们主要讲了为了避免overfitting,可以使用regularization方法来解决.在之前的EinEinE_{in}上加上一个reg ...
- 台湾大学林轩田机器学习基石课程学习笔记14 -- Regularization
红色石头的个人网站:redstonewill.com 上节课我们介绍了过拟合发生的原因:excessive power, stochastic/deterministic noise 和limited ...
- 台湾大学林轩田机器学习基石课程学习笔记12 -- Nonlinear Transformation
红色石头的个人网站:redstonewill.com 上一节课,我们介绍了分类问题的三种线性模型,可以用来解决binary classification和multiclass classificati ...
最新文章
- Swift 中使用 SQLite——修改和删除数据
- hadoop生态搭建(3节点)-06.hbase配置
- Tomcat官方文档关于数据源配置的内容
- 激进的中国技术选型,给世界技术的发展带来了什么?
- TCP协议的三次握手、四次挥手
- TensorFlow升级1.4:Cannot remove entries from nonexistent file \lib\site-pack
- mysql三种引擎_MySQL常见的三种存储引擎
- matlab如何把实验结果记录在文件中,实验一Matlab基本操作
- 九度OJ 1207 质因数的个数
- 素数筛选法--hdu4548美素数
- 常用三端稳压管型号大全对照表
- 共焦显微镜技术原理、参数及其应用
- csgo为什么显示vac无法连接服务器,csgovac无法验证您的游戏会话怎么办 看完你就知道了...
- 三维空间中直角坐标与球坐标的相互转换
- 【WPF】后台切换前台图片
- 四大机器学习降维算法:PCA、LDA、LLE、Laplacian Eigenmaps
- ORACLE安装方法
- 【JavaScript】offset、client、scroll
- MATLAB boxplot 修改箱子线型、设置箱子颜色、不同长度数据画箱线图、中位线改成黑色、箱线图虚线改实线
- 读刘润《底层逻辑》摘录