机器学习简介

即使是机器学习领域的专业人士,也很难给机器学习这一概念下一个准确的定义,比较常见的说法有两种。Arthur Samuel描述其为“使计算机无需明确编程就能自主学习的研究领域”,Tom Mitchell给了一个更为流行的解释为“一个计算机程序从经验E中学习某些类型的任务T和性能度量P,如果它在任务T中的性能(以P度量)随着经验E提高了,称之为具有机器学习能力。”

文章目录

  • 机器学习简介
    • 简介
    • 监督学习(Supervised Learning)
    • 非监督学习(Unsupervised Learning)
    • 发展状况
    • 补充说明

简介

  • 如今,机器学习作为人工智能的主要研究方向被落地使用于各个行业,机器学习算法的有效及强大备受关注,由基本的机器学习算法衍生了很多子方向如强化学习、深度学习等,这些领域归根结底都是经典的机器学习方法的扩充。
  • 一般将机器学习划分为两个类别,即监督学习和无监督学习,前者依据数据的特征和标签,后者只依赖数据的特征。

监督学习(Supervised Learning)

  • 监督学习是指训练算法的数据集的样本都有实际的标签(label)存在,如房价问题的房价、垃圾邮件识别问题的邮件类别。
  • 监督学习主要由分类(Classification)和回归(Regression)两个类别组成,回归问题要求预测连续的输出值如房价,分类问题要求预测离散的输出值如好或者坏。形象地说,回归问题要求找到一个尽量拟合训练数据分布的函数表达,分类问题要求找到一个尽量区分训练数据不太类别数据的分界线。某种程度上,这两种问题可以相互转化。
  • 如图,对于回归问题,尽量找到一条拟合全部数据的函数;对于分类问题,尽量找到区分不同类别样本的分界线函数。

非监督学习(Unsupervised Learning)

  • 非监督是指训练算法的数据集的样本只包含特征,而没有标签、目标之类的信息,我们不知道什么是好什么是坏,我们需要找到尽量区分不同样本的方法,如聚类算法。经典的问题如新闻主题聚合。
  • 非监督学习的典型问题是聚类问题,要求找出数据中的类型结构,并划分出来。
  • 如图,对于聚类问题,要求发现数据的潜在特性,进行类别划分。

发展状况

  • 目前,监督学习和非监督学习的发展如火如荼,然而取得较为实用的成就且能用于工业界的大多还是监督学习算法,换句话说,我们仍然需要大量的人工标注的数据用于模型的训练。
  • 当然,近些年很多深度学习方法(如自动编码器)被逐渐用于非监督学习领域,这也促使非监督学习的进一步发展。
  • 未来的强人工智能应该是更加依赖非监督学习算法,配合以监督学习算法的。

补充说明

  • 本文力求简洁介绍机器学习的一些基本概念,思路参照吴恩达的机器学习课程(Coursera)。
  • 本系列相关的博文和代码开放于Github,欢迎访问项目。同时博客也同步在我的个人博客网站,欢迎访问查看其他文章。
  • 由于能力有限,如有错误,欢迎评论指正。

机器学习-机器学习简介相关推荐

  1. 我爱机器学习 机器学习干货站- 资源

    我爱机器学习 机器学习干货站 跳至正文 机器学习 Deep Learning 所有主题 关注我们 DeepMind团队的<Deep Reinforcement Learning in Large ...

  2. 统计机器学习(机器学习) 概念

    统计机器学习(机器学习) 概念 该文章是作者阅读相关书籍和资料后,总结和归纳的一些个人认为有必要整理和了解的知识点介绍.与大家一起分享,如有不妥之处,还望指正. 统计(机器)学习 1.统计学习概念 统 ...

  3. 机器学习稀疏矩阵简介(附Python代码)

    对于一个矩阵而言,若数值为零的元素远远多于非零元素的个数,且非零元素分布没有规律时,这样的矩阵被称作稀疏矩阵:与之相反,若非零元素数目占据绝大多数时,这样的矩阵被称作稠密矩阵. 稀疏矩阵在工程应用中经 ...

  4. 机器学习与数据挖掘,机器学习算法简介

    ​什么是数据挖掘 数据挖掘就是从大量的数据中去发现有用的信息,然后根据这些信息来辅助决策.听起来是不是跟传统的数据分析很像呢?实际上,数据挖掘就是智能化的数据分析,它们的目标都是一样的.但是,又有很大 ...

  5. [译]使用scikit-learn进行机器学习的简介(教程1)

    原文:http://www.cnblogs.com/taceywong/p/4568806.html 原文地址:http://scikit-learn.org/stable/tutorial/basi ...

  6. 01.机器学习的简介

    一.机器学习的概念 定义:对于某类任务 T 和性能度量 P,如果一个计算机程序在 T上 以P衡量的性能随着经验E 而自我完善,那么就称这个计算机程序在从经验 E学习 机器学习时计算机科学的子领域,也是 ...

  7. Opencv学习笔记 - OpenCV 4机器学习算法简介

    在机器学习中,一些比较流行方法的包括:支持向量机(SVM).人工神经网络(ANN).聚类.k-最近邻.决策树和深度学习.OpenCV支持并实现几乎所有这些方法,并有详细的文档说明(包含在Main mo ...

  8. 【机器学习】 主流机器学习算法简介与其优缺点分析

    来源:EliteDataScience   专知 机器学习算法的分类是棘手的,有几种合理的分类,他们可以分为生成/识别,参数/非参数,监督/无监督等. 例如,Scikit-Learn的文档页面通过学习 ...

  9. weka机器学习-01-weka简介及基本概念

    1.weka主界面各个功能键概述 Explorer(探索者):最容易使用的图形用户界面,通过菜单和填写表单可以调用weka的所有功能. 缺陷:要求将所需数据全部依次读进内存,一旦用户打开某个数据集,就 ...

最新文章

  1. MySQL Order by 语句用法与优化详解
  2. 如何重新安装 Linux 的操作管理套件 (OMS) 代理
  3. 一篇读懂--mybatis的缓存
  4. python recv_[Python]关于socket.recv()的非阻塞用法
  5. 及时输出_安全光幕没有输出信号怎么办?-意普ESPE
  6. map文件分析 stm32_使用STM32内部Flash额外的空间来存储数据
  7. Python字符串index()方法应用案例一则
  8. python初级第三库(人工智能,web解析,人机交互)
  9. [译]JavaScript中的属性:定义和赋值的区别
  10. kettle oracle数据从库到库,kettle 使用oracle数据库当做资源库
  11. apscheduler报错maximum number of running instances
  12. Python注释符号(多行注释和单行注释)用法详解
  13. 苹果9L0-403测试对于被选入苹果认证支持专家(ACSP)10.6名称
  14. 【吐槽】Android 第一步,雀氏纸尿裤
  15. Gerrit项目权限设置总结
  16. [微语 20.11.21] 洞天
  17. Ext grid columns隐藏列
  18. Phong与Blinn-Phong
  19. HR详谈求职简历筛选之道
  20. 医院预约挂号小程序 毕业设计毕业论文 开题报告和效果图参考(基于微信小程序毕业设计题目选题课题)

热门文章

  1. 什么是Spring inner beans?
  2. NamespaceHandler 接口
  3. MyBatis的插入数据操作
  4. MybatisPlus性能分析插件
  5. 本地消息表实现机制讲解
  6. 资源权限操作-添加资源权限
  7. 登陆状态下加入购物车
  8. 文件上传案例优化(文件命名循环接收多线程提高效率)
  9. 脚手架工程:工程目录结构
  10. spring事务管理-xml配置aop事务(重点)