机器学习-机器学习简介
机器学习简介
即使是机器学习领域的专业人士,也很难给机器学习这一概念下一个准确的定义,比较常见的说法有两种。Arthur Samuel描述其为“使计算机无需明确编程就能自主学习的研究领域”,Tom Mitchell给了一个更为流行的解释为“一个计算机程序从经验E中学习某些类型的任务T和性能度量P,如果它在任务T中的性能(以P度量)随着经验E提高了,称之为具有机器学习能力。”
文章目录
- 机器学习简介
- 简介
- 监督学习(Supervised Learning)
- 非监督学习(Unsupervised Learning)
- 发展状况
- 补充说明
简介
- 如今,机器学习作为人工智能的主要研究方向被落地使用于各个行业,机器学习算法的有效及强大备受关注,由基本的机器学习算法衍生了很多子方向如强化学习、深度学习等,这些领域归根结底都是经典的机器学习方法的扩充。
- 一般将机器学习划分为两个类别,即监督学习和无监督学习,前者依据数据的特征和标签,后者只依赖数据的特征。
监督学习(Supervised Learning)
- 监督学习是指训练算法的数据集的样本都有实际的标签(label)存在,如房价问题的房价、垃圾邮件识别问题的邮件类别。
- 监督学习主要由分类(Classification)和回归(Regression)两个类别组成,回归问题要求预测连续的输出值如房价,分类问题要求预测离散的输出值如好或者坏。形象地说,回归问题要求找到一个尽量拟合训练数据分布的函数表达,分类问题要求找到一个尽量区分训练数据不太类别数据的分界线。某种程度上,这两种问题可以相互转化。
- 如图,对于回归问题,尽量找到一条拟合全部数据的函数;对于分类问题,尽量找到区分不同类别样本的分界线函数。
非监督学习(Unsupervised Learning)
- 非监督是指训练算法的数据集的样本只包含特征,而没有标签、目标之类的信息,我们不知道什么是好什么是坏,我们需要找到尽量区分不同样本的方法,如聚类算法。经典的问题如新闻主题聚合。
- 非监督学习的典型问题是聚类问题,要求找出数据中的类型结构,并划分出来。
- 如图,对于聚类问题,要求发现数据的潜在特性,进行类别划分。
发展状况
- 目前,监督学习和非监督学习的发展如火如荼,然而取得较为实用的成就且能用于工业界的大多还是监督学习算法,换句话说,我们仍然需要大量的人工标注的数据用于模型的训练。
- 当然,近些年很多深度学习方法(如自动编码器)被逐渐用于非监督学习领域,这也促使非监督学习的进一步发展。
- 未来的强人工智能应该是更加依赖非监督学习算法,配合以监督学习算法的。
补充说明
- 本文力求简洁介绍机器学习的一些基本概念,思路参照吴恩达的机器学习课程(Coursera)。
- 本系列相关的博文和代码开放于Github,欢迎访问项目。同时博客也同步在我的个人博客网站,欢迎访问查看其他文章。
- 由于能力有限,如有错误,欢迎评论指正。
机器学习-机器学习简介相关推荐
- 我爱机器学习 机器学习干货站- 资源
我爱机器学习 机器学习干货站 跳至正文 机器学习 Deep Learning 所有主题 关注我们 DeepMind团队的<Deep Reinforcement Learning in Large ...
- 统计机器学习(机器学习) 概念
统计机器学习(机器学习) 概念 该文章是作者阅读相关书籍和资料后,总结和归纳的一些个人认为有必要整理和了解的知识点介绍.与大家一起分享,如有不妥之处,还望指正. 统计(机器)学习 1.统计学习概念 统 ...
- 机器学习稀疏矩阵简介(附Python代码)
对于一个矩阵而言,若数值为零的元素远远多于非零元素的个数,且非零元素分布没有规律时,这样的矩阵被称作稀疏矩阵:与之相反,若非零元素数目占据绝大多数时,这样的矩阵被称作稠密矩阵. 稀疏矩阵在工程应用中经 ...
- 机器学习与数据挖掘,机器学习算法简介
什么是数据挖掘 数据挖掘就是从大量的数据中去发现有用的信息,然后根据这些信息来辅助决策.听起来是不是跟传统的数据分析很像呢?实际上,数据挖掘就是智能化的数据分析,它们的目标都是一样的.但是,又有很大 ...
- [译]使用scikit-learn进行机器学习的简介(教程1)
原文:http://www.cnblogs.com/taceywong/p/4568806.html 原文地址:http://scikit-learn.org/stable/tutorial/basi ...
- 01.机器学习的简介
一.机器学习的概念 定义:对于某类任务 T 和性能度量 P,如果一个计算机程序在 T上 以P衡量的性能随着经验E 而自我完善,那么就称这个计算机程序在从经验 E学习 机器学习时计算机科学的子领域,也是 ...
- Opencv学习笔记 - OpenCV 4机器学习算法简介
在机器学习中,一些比较流行方法的包括:支持向量机(SVM).人工神经网络(ANN).聚类.k-最近邻.决策树和深度学习.OpenCV支持并实现几乎所有这些方法,并有详细的文档说明(包含在Main mo ...
- 【机器学习】 主流机器学习算法简介与其优缺点分析
来源:EliteDataScience 专知 机器学习算法的分类是棘手的,有几种合理的分类,他们可以分为生成/识别,参数/非参数,监督/无监督等. 例如,Scikit-Learn的文档页面通过学习 ...
- weka机器学习-01-weka简介及基本概念
1.weka主界面各个功能键概述 Explorer(探索者):最容易使用的图形用户界面,通过菜单和填写表单可以调用weka的所有功能. 缺陷:要求将所需数据全部依次读进内存,一旦用户打开某个数据集,就 ...
最新文章
- MySQL Order by 语句用法与优化详解
- 如何重新安装 Linux 的操作管理套件 (OMS) 代理
- 一篇读懂--mybatis的缓存
- python recv_[Python]关于socket.recv()的非阻塞用法
- 及时输出_安全光幕没有输出信号怎么办?-意普ESPE
- map文件分析 stm32_使用STM32内部Flash额外的空间来存储数据
- Python字符串index()方法应用案例一则
- python初级第三库(人工智能,web解析,人机交互)
- [译]JavaScript中的属性:定义和赋值的区别
- kettle oracle数据从库到库,kettle 使用oracle数据库当做资源库
- apscheduler报错maximum number of running instances
- Python注释符号(多行注释和单行注释)用法详解
- 苹果9L0-403测试对于被选入苹果认证支持专家(ACSP)10.6名称
- 【吐槽】Android 第一步,雀氏纸尿裤
- Gerrit项目权限设置总结
- [微语 20.11.21] 洞天
- Ext grid columns隐藏列
- Phong与Blinn-Phong
- HR详谈求职简历筛选之道
- 医院预约挂号小程序 毕业设计毕业论文 开题报告和效果图参考(基于微信小程序毕业设计题目选题课题)