一、人工智能与机器学习

说到人工智能,就不得不提图灵测试。图灵测试是阿兰图灵在1950年提出的一个关于机器是否能够思考的著名实验,测试某机器是否能表现出与人等价或无法区分的智能。主要内容是:测试者与被测试者(一个人和一台机器)隔开的情况下,通过一些装置(如键盘)向被测试者随意提问。 进行多次测试后,如果测试者不能确定出被测试者是人还是机器,那么这台机器就通过了测试,并被认为具有人类智能。

通常我们认为一个智能系统需要具有以下几个能力:

  • 语言能力–自然语言处理:能成功地用自然语言交流
  • 记忆能力–知识表示:存储它知道的或听到的信息
  • 推理能力–自动推理:运用存储的信息来回答问题并推出新结论
  • 学习能力–机器学习:适应新情况并检测和预测模式
  • 感知能力–计算机视觉:感知物体
  • 规划能力–自动规划:根据资源制定执行策略

由此我们可以看出,机器学习是人工智能的一个分支,它是人工智能研究发展到一定阶段的必然产物。

二、机器学习的发展

二十世纪五十年代到七十年代初,人工智能研究处于”推理期“,人们认为只要能赋予机器逻辑推理能力,机器就具有智能。

随着研究向前发展,人们逐渐认识到,仅仅具有逻辑推理能力是远远实现不了人工智能的。要使机器具有智能,必须设法使机器拥有知识。

二十世纪七十年代中期开始,人工智能研究进入了“知识期”,但人们又认识到,由人来把知识总结出来再教给计算机是非常困难的。有人想到,如果机器能够自己学习知识就好了。

二十世纪八十年代是机器学习成为一个独立的学科领域、各种机器学习技术百花初绽的时期。(实际上最早图灵在1950年图灵测试的文章中就曾提到机器学习的可能,五十年代到七十年代有一些机器学习的研究如基于神经网络的连接主义学习、感知机、基于逻辑表示的符号主义学习、以决策理论为基础的学习技术、强化学习等。但机器学习独立成为一个学科领域是在八十年代。)

这时候,人们把机器学习划分为“机械学习”,“示教学习”,“类比学习”,“归纳学习”。

机械学习

死记硬背式学习,把外界输入的信息全部记录下来,需要时原封不动地取出来使用,实际上没有真正的学习,仅仅在进行信息存储与检索。

示教学习

从指令中学习。

类比学习

通过观察和发现学习。

归纳学习

从样例中学习,即从训练样例中归纳出学习结果。归纳学习是被研究最多,应用最广的,涵盖了监督学习、无监督学习等。

二十世纪八十年代,归纳学习的主流是符号主义学习,其代表包括决策树学习基于逻辑的学习。典型的决策树学习以信息论为基础,以信息熵的最小化为目标,直接模拟了人类对概念进行判定的树形流程。基于逻辑的学习的著名代表是归纳逻辑程序设计,可以看作机器学习与逻辑程序设计的交叉,使用一阶逻辑来进行知识表示,通过修改和扩充逻辑表达式来完成对数据的归纳。

二十世纪九十年代,归纳学习的主流是基于神经网络的连接主义学习

二十世纪九十年代中期,归纳学习的主流是统计学习,其代表是**支持向量机(SVM)**以及更一般的“核方法(kernel methods)”。

二十一世纪初,连接主义学习又卷土重来,掀起以“深度学习”为名的热潮。深度学习是指深层神经网络,它在语音、图像等复杂对象的应用中表现很好,性能优越。深度学习的流行一是因为大数据的发展,数据多了;二是因为计算机硬件的发展,计算能力强了。

三、机器学习的分类

机器学习中,有个定理叫**“没有免费午餐“定理**(No Free Lunch Theorem,简称NFL定理)。内容是无论学习算法a多聪明,学习算法b多笨拙,它们的期望性能是相同的。简而言之,就是没有一个通用算法可以完美解决所有问题,我们要根据具体问题来选择合适的算法。

根据训练数据是否带有标签(label)信息,把训练数据中带有标签信息的学习算法称为监督学习,训练数据中不带标签信息的学习算法称为无监督学习

监督学习的代表是分类回归,常见算法有线性回归、logistic回归、决策树、贝叶斯分类、支持向量机、神经网络等。

无监督学习的代表是聚类,常见算法有主成分分析(PCA)、K均值聚类(K-Means)等。

在后面的文章中会一一介绍这些算法和它们的代码实现,尽量给出不调包只用python代码实现和使用流行的机器学习框架实现两种实现方案。因为前者可以更好地理解算法,后者可以更快更方便地使用算法。 当然除了这些算法,还有数据预处理、模型的性能度量、超参数的调整等等。

【机器学习】机器学习简介相关推荐

  1. 我爱机器学习 机器学习干货站- 资源

    我爱机器学习 机器学习干货站 跳至正文 机器学习 Deep Learning 所有主题 关注我们 DeepMind团队的<Deep Reinforcement Learning in Large ...

  2. 统计机器学习(机器学习) 概念

    统计机器学习(机器学习) 概念 该文章是作者阅读相关书籍和资料后,总结和归纳的一些个人认为有必要整理和了解的知识点介绍.与大家一起分享,如有不妥之处,还望指正. 统计(机器)学习 1.统计学习概念 统 ...

  3. 机器学习-机器学习简介

    机器学习简介 即使是机器学习领域的专业人士,也很难给机器学习这一概念下一个准确的定义,比较常见的说法有两种.Arthur Samuel描述其为"使计算机无需明确编程就能自主学习的研究领域&q ...

  4. 机器学习稀疏矩阵简介(附Python代码)

    对于一个矩阵而言,若数值为零的元素远远多于非零元素的个数,且非零元素分布没有规律时,这样的矩阵被称作稀疏矩阵:与之相反,若非零元素数目占据绝大多数时,这样的矩阵被称作稠密矩阵. 稀疏矩阵在工程应用中经 ...

  5. 机器学习与数据挖掘,机器学习算法简介

    ​什么是数据挖掘 数据挖掘就是从大量的数据中去发现有用的信息,然后根据这些信息来辅助决策.听起来是不是跟传统的数据分析很像呢?实际上,数据挖掘就是智能化的数据分析,它们的目标都是一样的.但是,又有很大 ...

  6. [译]使用scikit-learn进行机器学习的简介(教程1)

    原文:http://www.cnblogs.com/taceywong/p/4568806.html 原文地址:http://scikit-learn.org/stable/tutorial/basi ...

  7. 01.机器学习的简介

    一.机器学习的概念 定义:对于某类任务 T 和性能度量 P,如果一个计算机程序在 T上 以P衡量的性能随着经验E 而自我完善,那么就称这个计算机程序在从经验 E学习 机器学习时计算机科学的子领域,也是 ...

  8. Opencv学习笔记 - OpenCV 4机器学习算法简介

    在机器学习中,一些比较流行方法的包括:支持向量机(SVM).人工神经网络(ANN).聚类.k-最近邻.决策树和深度学习.OpenCV支持并实现几乎所有这些方法,并有详细的文档说明(包含在Main mo ...

  9. 【机器学习】 主流机器学习算法简介与其优缺点分析

    来源:EliteDataScience   专知 机器学习算法的分类是棘手的,有几种合理的分类,他们可以分为生成/识别,参数/非参数,监督/无监督等. 例如,Scikit-Learn的文档页面通过学习 ...

  10. weka机器学习-01-weka简介及基本概念

    1.weka主界面各个功能键概述 Explorer(探索者):最容易使用的图形用户界面,通过菜单和填写表单可以调用weka的所有功能. 缺陷:要求将所需数据全部依次读进内存,一旦用户打开某个数据集,就 ...

最新文章

  1. DELL备份恢复系统的小工具 Dell DataSafe Local Backup
  2. 操作系统第二章 进程管理
  3. Servlet获得Http请求,GET/POST
  4. Python超越Java语言,跃居世界编程语言第2位了!你却还在犹豫学不学Python?
  5. mysql数据库入门教程(5):多表操作(连接查询,子查询,分页查询,联合查询)
  6. java mysubmail_关于MyBatis10种超好用的写法(收藏)
  7. Free Mybatis plugin
  8. 液压支架销轴力学计算分析研究_技术 | 篦冷机液压管路问题分析及改造措施
  9. python中字符串str的strip()方法
  10. Linux取消挂载,删除用户及其目录
  11. 导体、良导体、超导体与半导体
  12. Sqlserver2005附加数据库时出错提示操作系统错误5(拒绝访问)错误5120的解决办法...
  13. C++ STL容器在for循环中删除迭代器 正确方法 it++正确吗
  14. vi命令下编辑文件时,按insert键文件底部无法编辑
  15. 12000字解读安踏:DTC中国化的“热血战纪”
  16. android qq 邮箱格式,QQ邮箱的正确格式有哪些?文件夹怎么发送呢
  17. 深造分布式 打败面试官 招式三 直捣黄龙
  18. mysql 字段被截断_msyql存储数据时字段被截断
  19. 与你分享如何做好企业汇算清缴
  20. word页码设置一些问题

热门文章

  1. Mycat批量插入性能测试
  2. PythonPyCharm
  3. python打开本地浏览器_python如何实现打开浏览器
  4. 从真假美猴王谈起 - 让套牌车、克隆x 无处遁形的技术手段思考
  5. 压力、焦虑还是抑郁? 正确诊断再治疗
  6. 计算机中考在线评分卡,提前了解中考电脑阅卷流程,看完绝对提分,附备考建议...
  7. shell脚本编程学习笔记7(XDL)——字符处理命令和条件判断
  8. 高防CDN在防御DDoS攻击中必不可少?简析高防CDN针对防御DDoS攻击的可行方案
  9. 数据家新三板挂牌上市
  10. 道格的账号_雅虎的道格削减MapReduce与Hadoop的未来