什么是机器学习?
 
在1959年,Arthur Samuel:不用编程去指定机器做什么,而是让机器有能力自己学习;
在1998年,Tom Mitchell:首先定义任务T,经验E,表现P,如果机器有一个任务T,随着经验E的增多,表现P也会变好,则表示机器正在经验E中学习;
以上就是对机器学习的两个定义;
机器学习在生活中也处处可见,比如:
(1)在gmail中,提供了一个“垃圾邮件”选项,可以通过机器学习辨别邮件是否为垃圾邮件,此处利用了分类算法;
如果我们根据Tom Mitchell的定义,则:
T:classify email as spam or not spam.
E:watching you label emails as spam or not spam.
P:The number of emails correctly classified as spam or not spam.
(2)ebay利用学习型算法判断某个信用卡是否被盗;
(3)“深蓝”下棋胜过国际象棋大师,是因为“深蓝”已经通过机器学习的方法学习了下棋的技术;
以上这些例子就是机器学习的常见案例;
机器学习的常见算法分为:
(1)Supervised Learning(监督学习):下面的图片就是典型的监督学习的例子,监督学习分为Classifying和Regression,两者的区别后面解释,下图的文字明确地解释了监督学习的定义:
监督学习的例子:垃圾邮件的分类,这个在上面已经讲解过;
(2)Unsupervised Learning(非监督学习):给定一组数据,这些数据从外表上来看没有什么差别,都落在了坐标轴上,我们的目标是从中找出结构,并将其分组,如下图,是聚类的例子,每个数据都是以原点的形式出现的,但是我们能够很清晰地将这些点分成两组(group into):
非监督学习的例子:
  • google News中,会将一些新闻进行聚类(分组),即每个大类的新闻下面都会有多个URL,这些URL虽然来自不同的网站,但是都是这一类新闻,比如:
  • Market segmentation:将客户分组为几组,对每组客户进行不同的销售手段,如下图:

  • 两个人在话筒前面同时说话,录音后发现这两个人的声音会混杂在一起,但是如果通过非监督学习,则可以将这两个人的声音分离开来;
以上介绍了机器学习的常见分类(监督学习和非监督学习),并详细介绍了定义及应用;
刚才我们说到监督学习分为:
(1)分类;
(2)回归;
这两者有什么区别呢?
区别在于分类的output为离散的,而回归的output为连续的,这样讲可能比较抽象,比如上面的例子就是回归,因为output为price,虽然看起来price是离散的,但是他的值是可以无限制的,因此是连续的,而下图为分类的例子,因为output=恶性or良性,可能的取值就两个值,因此为回归;

 
以上说明了分类和回归的区别;

 
练习题

 
1.你现在在证券所上班,对于某个特定的股票A,希望根据以往的价格走势,来推算出明天的价格是多少,这算是分类问题还是回归问题?
答:属于回归问题,因为股票的价格是连续的,因此是回归问题;
2.我们给出4个问题:
  • 我们已经知道了这一堆是垃圾邮件,想要将这些垃圾邮件继续分子类;
  • 给定一个数据集,全是心脏病的病人,我们需要将他们分成不同的簇,对每个簇用不同的治疗方法;
  • 两个足球队要比赛,根据以往的数据,预测哪个队会赢;
  • 根据一个人的DNA,预测10年后得糖尿病的几率;
哪些是监督学习,哪些是非监督学习?
答:(1)和(2)是监督学习,(3)和(4)是非监督学习;

机器学习入门:机器学习概论相关推荐

  1. 机器学习入门-机器学习的不同类型

    机器学习指的是机器通过学习数据,得到技巧的过程.比如,现在需要让机器学习病人判断是否获病.我们可以从目标整体(population)所有人中抽出用以训练的样本(sample),把这些样本的病人.正常人 ...

  2. 机器学习-机器学习概论(入门机器学习基础知识)

    机器学习 简介 机器学习一词来源于Machine Learning的翻译,主要研究计算机模拟或者实现人类的行为,顾名思义,像学生一样,通过学习获取新的知识或者技能,完善自身的知识结构,并不断提升自己的 ...

  3. 机器学习入门资源不完全汇总

    机器学习入门资源不完全汇总 基本概念|入门攻略|课程资源|论坛网站|东拉西扯 2014-10-14版, 好东西传送门编辑整理, 原文链接 http://ml.memect.com/article/ma ...

  4. 机器学习入门资源--汇总

    机器学习入门资源--汇总 基本概念 机器学习 机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论.统计学.逼近论.凸分析.算法复杂度理论等多门学科.机器学习理论主要是设计和分析一些让计算机可以自 ...

  5. 《机器学习入门实战》第 01 篇 如何入门机器学习?

    文章目录 机器学习与数据挖掘 传统入门方法的问题 逆向学习方法 专栏内容介绍 目标人群 专栏章节 机器学习与数据挖掘 如果你是一个想要入门数据科学的初学者,首先需要面对的就是各种相关的名词和概念.例如 ...

  6. python 非线性回归_机器学习入门之菜鸟之路——机器学习之非线性回归个人理解及python实现...

    本文主要向大家介绍了机器学习入门之菜鸟之路--机器学习之非线性回归个人理解及python实现,通过具体的内容向大家展现,希望对大家学习机器学习入门有所帮助. 梯度下降:就是让数据顺着梯度最大的方向,也 ...

  7. 【机器学习入门】(13) 实战:心脏病预测,补充: ROC曲线、精确率--召回率曲线,附python完整代码和数据集

    各位同学好,经过前几章python机器学习的探索,想必大家对各种预测方法也有了一定的认识.今天我们来进行一次实战,心脏病病例预测,本文对一些基础方法就不进行详细解释,有疑问的同学可以看我前几篇机器学习 ...

  8. 【机器学习入门】(10) 特征工程:特征抽取,字典特征抽取、文本特征抽取,附完整python代码

    各位同学好,今天和大家介绍一下python机器学习中的特征工程.在将数据放入模型之前,需要对数据的一些特征进行特征抽取,方法有: (1) 字典特征抽取 DictVectorizer(),(2) 文本特 ...

  9. matlab 职坐标,机器学习入门之机器学习实战ByMatlab(四)二分K-means算法

    本文主要向大家介绍了机器学习入门之机器学习实战ByMatlab(四)二分K-means算法,通过具体的内容向大家展现,希望对大家学习机器学习入门有所帮助.前面我们在是实现K-means算法的时候,提到 ...

  10. 十年公务员转行IT,自学AI三年,他淬炼出746页机器学习入门笔记

    整理 | Jane 编辑 | Just 出品 | AI科技大本营(ID:rgznai100) 近期,梁劲传来该笔记重大更新的消息.<机器学习--从入门到放弃>这本笔记的更新没有停止,在基于 ...

最新文章

  1. 《未来架构师》的教学范例(1)
  2. JavaWeb学习之路——SSM框架之Spring(五)
  3. Nginx + Tomcat Windows下的负载均衡配置
  4. Java Annotaion认识
  5. 查看windows下指定的端口是否开放
  6. 【TensorFlow系列】【九】利用tf.py_func自定义算子
  7. Win10自定义开始菜单磁贴背景颜色及图标
  8. 无线网破解 跑字典 EWSA使用教程
  9. unity支持的模型数据格式,unity3d模型制作规范
  10. 历史类:四大文明古国
  11. Ardupilot环境搭建
  12. Openvino学习之openvino2022.1版安装配置
  13. 101页下载 机器学习、深度学习绘图模板.ppt
  14. 聚合物钽电容和普通钽电容的区别
  15. 关于PTA题目集1-3的总结
  16. json-server使用详解
  17. 【MATLAB-app】系列教程(含视频)第2课_实例:使用appdesigner 制作简单的计算器
  18. 通达OA外部邮件密码加密和解密的方式,可以参考用作其他
  19. #.数学函数3D图的绘制
  20. 三网话费、电费充值API接口文档、充值系统

热门文章

  1. C#透明窗体实现方法
  2. C++学习基础八——重载输入和输出操作符
  3. 兼容浏览器将NodeList对象转换为数组
  4. java field, property,variable及getField和getDeclaredField的区别
  5. 1700 Crossing River
  6. 算法导论-排序(四)计数排序(线性时间排序)
  7. 基于C#在WinCE6.0系统SQLCE3.5的安装开发使用
  8. (未写)tyvj-1333- Coder Space的邀请
  9. 2015年第六届蓝桥杯 - 省赛 - C/C++大学B组 - C. 三羊献端
  10. 大数据WEB阶段 shiro安全控制框架