Why do we learn Machines Learning

之前虽然学过逻辑回归LR,支持向量机SVM等机器学习的零星小片段,还有深度学习也做过很多事情。但是总觉得该抽点时间系统的学习下机器学习了,要不总觉得缺点啥。刚好,自己有视频资料,其实b站上也有,如果你们想学可以给我要视频资料,也可以去b站上看。

咱们先说下深度学习和机器学习的关系,深度学习属于机器学习,但是深度学习自己都快成了一个独立的分支了,因为对于它的研究已经基本超过其他机器学习了,比如现在的计算机视觉或者自然原因处理的论文,如果你没有用到深度学习,那基本都把你pass掉了。

话又话又说回来,有人说深度学习这么火了,为什么还要学机器学习呢?我觉得原因有三点:

  1. 深度学习虽然火,但是现在也只能算是刚兴起,工业界用的最多的目前还是机器学习和以前传统的方法。

  2. 如果想用到深度学习,那基本是你的数据量特别庞大的时候。但是现在很多公司数据量没有那么庞大,只用普通的方法就行。

  3. 机器学习理论还是很值得我们探索的,即使有些方法我们或许用不上,但是它的推导和核心的思维方式或许能帮我们打开很多视野,也能帮助我们迅速理解以后突然出现的新的方法。说实话,每天都会有上百种新的机器学习方法的提出,只要掌握了机器学习的基础,那就。。嘿嘿   一句话,万变不离其宗O.O

------仅属于个人理解

好啦,我们开始啦。

导读

为了详细学习机器学习的基石,我们总体大纲会从四个大方面讲解(这次和以后):

1.在什么情况下我们可以用机器来学习?

2.为什么机器可以学习?

3.机器怎么学习?

4.机器怎么能学习的更好?

即:

本章我们会围绕着第一个讲解:

在什么情况下我们可以用机器来学习?

那么在这节中,我们将会从以下面四个小方向来讨论:

  1. 什么是机器学习?

  2. 机器学习的应用有哪些?

  3. 机器学习的要素有哪些?

  4. 机器学习和其他的相关领域

即:

What is Machines Learning

我们先说learning:

在我们很小的时候从叽叽呀呀到在一岁左右开始学喊爸爸妈妈,再到后来的吞吞吐吐说话,最后到都nb的开始学习人家的国外的语言了。我们的这个过程就是一个最最简单的learning的过程,是在不断学习别人的过程。

大概概括就是,人通过观察,不断地学习不断地累计经验的过程。

那么Machines Learning是怎么回事呢?

机器不是生物,没有意识,那么怎么能学习呢?对,那就是data,我们通过喂给机器数据,让机器来学习其中的规则,获取相应的技能的过程。

那么什么是技能skill呢?

提高某种表现形式(比如准确率呀等)

而Machines Learning也是这么个过程:

比如一些实例应用:

炒股票,有个任务让你根据最近几年的股票来预测这个时刻,我是该买呢?还是该卖?那你可肯定得需要很长时间来考虑和计算了。但是如果把

data给了机器,让data预测,那都是分分秒的事。

比如我们要弄个机器人去火星,因为我们人类没去过,所以,我们不能给机器传输一些我们知道的规则,那就需要机器自己到火星上去学习。

比如有一个应用,识别树,你通常会先想你是怎么定义树的,但是这个是比较难的,我们当时刚出生的时候,难道爸妈告诉我们那个绿的,高的,长得那个样子等等的是树吗?显然不是。那么我们是这么学的呢?对了,我们是通过观察,累计经验的,所以,我们需要用机器学习,让机器自己学习特征来判别。

当这几种情况的时候,我们可以使用机器学习:

  1. 当人类不能人工的编写这个系统的时候

  2. 当人类不能很容易的定义这个问题的时候

  3. 当需要快速做出决定而人不能的时候

  4. 当需要为客户做定向服务的时候

etc.

授之以渔,而非授之以鱼。

那么到底问题应该具备哪些特定的元素才能用机器学习呢?

  1. 有潜藏的规律的

  2. 不能简单的用程序定义的

  3. 有data,也就是有input

那咱们做几道题把,看看哪些可以用到机器学习?

回答:

  1. 孩子哭泣无规律呀,所以pass

  2. 圆的规律太明显,直接编程即可,pass

  3. 这个可以:a.有pattern即客户的行为,b.很难用程序来定义,c.他的历史银行运作信息

  4. 这个。。没有足够的数据啊。(庆幸没有足够数据O.O)

Applications of Machines Learning

这里就很多啦,比如我们的衣食住行中的例子:

  1. 食:根据Twitter上的数据来预测饭店的好坏

  2. 衣:根据销售数字和顾客调查来给顾客推荐衣服

  3. 住:根据建筑的特征和他们建筑时的消耗预测其他建筑得消耗

  4. 行:根据一些交通信号的图片和它的意义来准确预测在行进时对交通信号的判定,比如现在火的智能驾驶

其他的比如在学生教育上面:

对学生历年来答题的数据进行学习,来预测学生在某道题上是否能答对。

在娱乐方面:

从用户评价过的电影中学习,可以给用户推荐电影。

针对这些还有很多比赛:

那么比如电影推荐系统怎么做呢?

如图所示(简化描述,现实肯定没这么简单):

我们用一个数组表示客户的喜好,比如第一个表示喜欢喜剧?第二个表示喜欢动作片?等

另一个数组表示电影的特征,比如第一个喜剧的内容,第二个表示动作片的内容等

这两个数组的数据要对应,一个是喜欢喜剧?那么另一个就是喜剧内容。最后都以分值得形式呈现,对应位相乘在一起,最终得分高的就是推荐的。

Components of Machines Learning

那么具体的机器学习什么元素呢?现在就来讲讲

比如我们为一个客户判定该不该给客户申请信用卡?

我们有的信息只有他们填表的时候的信息

那么我们来说下机器学习到底具体需要什么以及怎么个流程:

input x:用户信息

output y:预测申请卡的好坏

目标函数f:f(x)=y

而data就是每个用户y的信息x的集合

假设函数g:机器学习的目标就是缩短和理想的函数f的差距。

公式简化为:

而这是这个流程就为:

H是猜测的所有可能集合,比如:

h1:年收入大于80W(这个可能性最大)

h2:负债大于10W(这个可能性最下)

h3:每年内有小于等于2个工作(不确定)

etc.

g从这个里面选取(也或许是选几个),最终选取正确率最高的当做最终的g函数尽肯能的接近target 函数f:

Machines Learning and Other Fields

机器学习与数据挖掘:

数据挖掘就是通过大量的数据发现有趣的属性,如果这个属性和求得接近于真实函数f的假设g过程一样,那么机器学习和数据挖掘就是一样的;如果这个属性和求得接近于真实函数f的假设g过程相似则数据挖掘可以帮助机器学习;但是在数据方面,它俩是一样的。

机器学习与人工智能

在追求g趋近于f上这俩是相似的,而对于比如下棋来说,就有两种方法,一种是传统的,一种是机器学习。总的来说,机器学习是实现人工智能的一种方法。

机器学习与统计

统计可以实现机器学习;传统而统计可以用来数学预测,但是在计算上就欠佳了。总之,统计中的很多方法适用于是机器学习的实现。

Summary

一图胜千言:


更多精彩内容,请关注 深度学习自然语言处理 公众号,就是下方啦!跟随小博主,每天进步一丢丢!哈哈!

详解机器学习之the Learning Problem相关推荐

  1. 美团技术团队:实例详解机器学习如何解决问题

    参考文献: 1. 美团技术团队:实例详解机器学习如何解决问题 2. 美团团队技术博客

  2. 详解机器学习的凸优化、图神经网络、强化学习、贝叶斯方法等四大主题

    AI是一门入门简单,但想深入却很难的学科,这也是为什么AI高端人才一直非常紧缺的重要原因.在AI领域技术领域,我们可以说机器学习功底决定了一个人的上限也不为过.为什么?机器学习就像物理学中的数学,如果 ...

  3. 林轩田机器学习基石--The Learning Problem

    林轩田老师的课可以整体分成四个部分. 1.When Can Machines Learn? 2.Why Can Machines Learn? 3.How Can Machines Learn? 4. ...

  4. 通俗易懂详解机器学习中的最大似然估计

    讲解前看个例子: 例子(一个场景): 1.一个盒子里有很多小球,颜色有白色(用w表示)和黑色(用b表示). 条件:(1) 盒子里面小球很多,n个. (2) 只有2中颜色的小球 2. 从盒子里取出来10 ...

  5. 两个特征是独立好还是正相关好_长文之详解机器学习的数据特征选择问题

    在许多机器学习相关的书里,很难找到关于特征选择的内容,因为特征选择要解决的问题往往被视为机器学习的一个子模块,一般不会单独拿出来讨论. 但特征选择是一个重要的数据预处理过程,特征选择主要有两个功能: ...

  6. 相对熵与交叉熵_详解机器学习中的熵、条件熵、相对熵、交叉熵

    目录 信息熵 条件熵 相对熵 交叉熵 总结 一  信息熵 (information entropy) 熵 (entropy) 这一词最初来源于热力学.1948年,克劳德·爱尔伍德·香农将热力学中的熵引 ...

  7. 详解联邦学习Federated Learning

    今天我们来讲下最近比较博眼球的联邦学习.应该很多人听过但是始终都没懂啥是联邦学习?百度一下发现大篇文章都说可以用来解决数据孤岛,那它又是如何来解决数据孤岛问题的?对于联邦学习,大部分文章还都处于其学术 ...

  8. 详解机器学习中的熵、条件熵、相对熵、交叉熵

    欢迎大家关注我们的网站和系列教程:http://www.tensorflownews.com/,学习更多的机器学习.深度学习的知识! 目录 信息熵 条件熵 相对熵 交叉熵 总结 一 信息熵 (info ...

  9. 【超全】一文详解机器学习特征工程(附代码)

    特征工程是使用专业背景知识和技巧处理数据,使得特征值(自变量)能在机器学习算法上发挥更好的作用的过程.python的sklearn库,对于特征工程的处理提供了强大的接口. 在本文中,我将详细介绍特征工 ...

  10. 机器学习是什么?详解机器学习概念

    说到人工智能必然要了解机器学习,从信息化软件,到电子商务,然后到高速发展互联网时代,到至今的云计算.大数据等,渗透到我们的生活.工作之中,在互联网的驱动下,人们更清晰的认识和使用数据,不仅仅是数据统计 ...

最新文章

  1. 北京尚学堂|程序员励志名言
  2. Android 的简介和体系结构中每个层的功能。
  3. .NET Core开发实战(第23课:静态文件中间件:前后端分离开发合并部署骚操作)--学习笔记(上)...
  4. 上海事业编制 计算机 待遇怎么样,事业单位情况
  5. MySQL索引类型总结和使用技巧以及注意事项
  6. 在VC++ 6.0下利用共享内存、消息实现内部进程通讯
  7. 开发人员学习文档下载地址
  8. 使用 WinRAR 将bat转exe
  9. sharepoint 2010如何下载文件
  10. python 通达信公式函数,python使用通达信公式,请人用python编写如下公式,我对编程一窍不通...
  11. 【cs230】吴恩达Deep Learning-3/3
  12. 转: 特征值和特征向量--1
  13. [4G5G专题-62]:架构 - 开放的网络自动化平台ONAP(Open Network Automation Platform)
  14. php如何把文字加粗,HTML中如何将字体加粗
  15. 量子通信借助计算机,量子通信技术核心——量子计算算法
  16. 商品ETF的分类及运作模式
  17. 动目标显示matlab仿真,动目标显示与脉冲多普勒雷达 (MATLAB程式设计)
  18. IIC协议编程要点,24C04为例
  19. 时间序列统计特征的详细解析
  20. java事务 spring事务 分布式事物

热门文章

  1. solr集群solrCloud的搭建
  2. Ubuntu中软件安装与卸载
  3. 父子类之间,成员函数重写、重载以及重定义的区别
  4. 海量小文件存储(转)
  5. Problem L. Visual Cube(杭电多校2018年第三场+模拟)
  6. Python并发编程:多线程-Thread对象的其它属性和方法
  7. dedecms有缩略图则显示缩略图,没有则显示随机缩略图
  8. MAC Terminal 用颜色区分不同类型的文件
  9. Jquery表单与表格的运用
  10. ios系统框架一: Core Animation