统计机器学习(机器学习) 概念
统计机器学习(机器学习) 概念
该文章是作者阅读相关书籍和资料后,总结和归纳的一些个人认为有必要整理和了解的知识点介绍。与大家一起分享,如有不妥之处,还望指正。
统计(机器)学习
1.统计学习概念
统计学习也叫统计机器学习(statistical machine learning),是概率论、统计学、信息论、计算理论、最优化理论及计算机科学等多个领域的交叉学科,并且在发展中逐步形成独自的理论体系与方法论。现在提及的机器学习往往指的是统计机器学习。
Herbert A.Simon对“学习”的定义是:如果一个系统能够通过执行某个过程来改进它的性能,这就是学习。
Mitchell,1997 给学习的一个形式化定义:假设用P来评估计算机程序在某一任务类T上的性能,若一个程序通过利用经验E在T中任务上获得了性能改善,则我们就说关于T和P,该程序对E进行了学习。
1956年,在IBM公司研发了西洋跳棋程序的Arthur Samuel 发明了machine learning 一词,将其定义为“不显式编程地赋予计算机能力的研究领域”。
2. 基本假设
统计学习关于数据的基本假设是同类数据具有一定的统计规律性。这里的同类数据指的是具有同类性质的数据,“某一类”的数据。之所以称之为“某一类”就说明数据呈现相同的性质,而往往也具有相同的统计特性。
3. 统计学习方法
统计学习由监督学习、半监督学习、无监督学习、强化学习等组成。主要讨论有监督学习(有监督学习研究相对而言比较成熟和深入,也具有代表性)。书本的概括如下:
从给定的、有限的、用于学习的训练数据集合出发,假设数据是独立同分布产生的;并且假设要学习的模型属于某个函数的集合,称为假设空间(hypothesis space);应用某个评价准则,从假设空间中选取一个最优的模型,使得它对已知训练数据及未知测试数据在给定的评价准则下有最优的预测;最优模型的选取由算法实现。这样统计学习方法就包括模型的假设空间、模型的选择准则和模型的学习算法,称为统计学习方法的三要素,简称:模型(model)、策略(strategy)、算法(algorithm)。可以更形象的称之为:
方法=设想+指标+方案
4. 基本术语
机器学习: machine learning
模型: model
数据集: data set
示例: instance
样本: sample
属性: attribute
特征: feature
属性值: attribute value
属性空间: attribute space
样本空间(输入空间): sample space
特征向量: feature vector
维数(维度): dimensionality
学习: learning
训练: training
训练样本: training sample
训练集: training set
假设: hypothesis
真实(真相): ground truth
预测: prediction
标记(标签): label
样例: example
标记空间(输出空间):label space
分类: classification
回归: regression
二分类: binary classification
正类: positive class
反类: negative class
多分类: multi-class classification
测试: testing
测试样本: testing sample
聚类: clustering
簇: cluster
有监督学习: supervised learning
无监督学习: unsupervised learning
泛化: generalization
分布: distribution
独立同分布: independent and identically distributed. i.i.d.
归纳: induction
演绎: deduction
特化: specialization
概念: concept
版本空间: version space
输入空间:input space
输出空间: output space
特征空间: feature space
决策函数: decision function
损失函数: loss function
主要参考资料:
《统计学习方法》李航著
《机器学习实战》Peter Harrington著 李锐等译
《机器学习》周志华 著
《模式分类》Richard O.Duda 等著
统计机器学习(机器学习) 概念相关推荐
- 从零开始的AI·机器学习の基本概念
从零开始的AI系列 机器学习の基本概念 从零开始的AI系列 一.机器学习の相关术语及其理解 二.机器学习の学习任务 分类 回归 聚类 特征降维与低维可视化 三.机器学习の学习范式 监督式学习 半监督式 ...
- 机器学习核心概念、常用术语整理(建议收藏)
[转]机器学习核心概念完全解析(建议收藏) 原文链接:https://mp.weixin.qq.com/s/wEpmF1gdvsIimnvXrxKdRw AI干货知识库 刚接触机器学习框架 Tenso ...
- 机器学习从入门到创业手记-1.2 机器学习的概念
坐在公司宽敞的会议室里,面前是一杯现煮的咖啡,公司的CEO 站在大的投影屏幕前意气风发,举手投足间透露出成功人士的魅力. "首先欢迎各位加入爱视达智能科技有限公司,我是公司的联合创始人 Da ...
- PRML读书会第一章 Introduction(机器学习基本概念、学习理论、模型选择、维灾等)...
主讲人 常象宇 大家好,我是likrain,本来我和网神说的是我可以作为机动,大家不想讲哪里我可以试试,结果大家不想讲第一章.估计都是大神觉得第一章比较简单,所以就由我来吧.我的背景是统计与数学,稍懂 ...
- 机器学习基本概念知识汇
目录 目录 背景 机器学习 基本概念 机器学习方法 监督学习 无监督学习 半监督式学习 强化学习 机器学习中分类与聚类的本质区别 分类 聚类 分类与聚类的比较 机器学习算法分类 回归算法 基于实例的算 ...
- 机器学习笔记(一)numpy的使用、机器学习基础概念
目录 1.numpy 1.1.创建 numpy.array 1.1.1.常规创建 numpy.array 的方法 1.1.2.其他创建 numpy.array 的方法 1.1.2.其他创建随机数 ra ...
- [云炬python3玩转机器学习笔记] 2-1机器学习基础概念
机器学习基础概念 一.关于数据 本文约定: 大写表示矩阵 小写表示向量 上标代表第几个样本 下标代表第几个特征 一般向量都表示为列向量 特征空间:每个维度都可以表示一个特征,形成一个空间(2D,3D, ...
- 统计与机器学习的异同
学习笔记,仅供参考,有错必纠 摘自:机器学习-算法背后的理论与优化; 文章目录 统计与机器学习 统计 机器学习 统计与机器学习的差异 统计与机器学习 自机器学习出现以来,关于它和统计之间关系的讨论就没 ...
- 短小精悍-机器学习核心概念、模型、基础知识点简明手册-免费分享
该手册只有130页,整理了几乎所有关机机器学习的概念.模型.基础知识点,它将帮助读者快速回顾关于机器学习相关的核心知识点和重要公式.模型.概念.涉及概率模型.处理离散数据的生成模型.高斯模型.贝叶斯模 ...
最新文章
- c# 一些控件常用屬性
- ASP.NET中DataGrid鼠标经过感知以及点击行弹出窗口
- 初学api测试_面向初学者的API-在此免费视频课程中学习如何使用API
- 您不是专业测试人员的10个理由!
- 求职技巧—2014六个秘诀二 - 年求职
- 安徽省二级c语言笔试样题,安徽省二级C语言程序设计笔试样题1
- 模块XX.dll已加载,但对DllRegisterServer的调用失败
- spring分布式事务示例_Spring声明式事务示例
- 链接学习之obj文件探索
- shell判定一个变量等于-n_Shell test命令:条件判断,检查某条件是否成立
- Delphi WebBrowser控件的使用
- java项目qq聊天室_简单的qq聊天室项目(作者涂俊伟)
- python怎么计算圆上任意两点的距离_圆周上两点距离-python
- 二货同事!写上千行的类!这样的代码让我生不如死!
- 极客大学架构师训练营 系统架构 一致性哈希 Consistent Hashing 第五次作业
- python课设参考文献_Python课程设计任务书
- C1见习工程师能力认证 考纲
- 利用pygame写星球大战小游戏
- 网络营销中的动态定价策略
- math_基本初等函数图型(幂函数/指数/对数/三角/反三角)