机器学习中的一些概念
显著式编程:显著式编程从一开始就定死了程序的输入和输出。
非显著式编程:让计算机自己总结规律的编程方法叫做非显著式编程。非显著式编程是让计算机通过数据、经验自动的学习完成我们交给的任务。
机器学习关注的是非显著式的编程。
按照任务是否需要和环境交互获得经验,将机器学习分为监督学习和强化学习。
强化学习:(Reinforcement Learning)计算机通过与环境的互动,逐渐强化自己的行为模式。
监督学习根据数据标签存在与否分为:
(1)传统的监督学习(Traiditional Supervised Learning)每一个训练数据都有对应的标签
传统的监督学习包含算法包括:
- 支持向量机(support vector machine)
- 人工神经网络(neural networks)
- 深度神经网络(deep neural networks)
(2)非监督学习(Unsupervised Learning)所有的训练数据都没有对应的标签。
非监督学习包含算法包括:
- 聚类(clustering)
- EM算法(Expectation-Maximization algorithm)
- 主成分分析(principle component analysis)
(3)半监督学习(Semi-Supervised Learning)训练数据中一部分有标签,一部分没有标签。
另一种分类方法是基于标签的固有属性,将监督学习分为分类和回归:
分类:(classification)如果标签是离散的值我们叫做分类。比如人脸识别就是分类问题。
回归:(regression)如果标签是连续的值我们叫做回归。预测房价是回归问题,因为房价是一个连续的变量。
机器学习的重点不是研究如何提取特征,而是假设在已经提好了这么多特征的前提下,如何构造算法获得更好的性能。
No Free Lunch Theory。----没有普适的、放之四海而皆准的算法。
机器学习的步骤:
(1)特征提取(Feature Extraction):是指通过训练样本获得的,对机器学习任务有帮助的多个维度特征数据。
机器学习的重点不是研究如何提取特征,而是假设在已经提取好特征的前提下,如何构造算法获得更好的性能指标。所以机器学习是假设已经在获得特征的前提下,研究合理的算法,使学习系统获得较好的性能。
(2)特征选择(Feature Selection),即对特征进行取舍。
(3)如何基于特征构建算法。(比如采用支持向量机)
基础科普:
线性可分:(Linear Separable)在二维空间中使用一条直线就可以将其区分开,三维空间中使用的是平面将其区分开,四维以及四维以上的空间使用的是超平面。
线性不可分:(Nonlinear Separable)
上述对于线性可分和线性不可分的定义只是局限于二分类问题,对于类别数大于2的情况需要给出线性可分与线性不可分的严格定义。
数学定义证明:在二分类的情况下,如果一个数据集是线性可分的,即存在一个超平面将两个类别完全分开,那么一定存在无数多个超平面将这两个类别完全分开。
证明见链接:
支持向量机中的三种内核:
(1)线性内核;
(2)多项式内核;
(3)高斯径向基函数核(rbf内核)
为了理解方便,可以把这三种内核看做三种不同的机器学习算法。
机器学习中的一些概念相关推荐
- 《机器学习》Chapter 1 绪论——机器学习中的基本概念和术语
<机器学习>Chapter 1 绪论 机器学习中的基本概念和术语 首先,通过思维导图来描述一下西瓜书第一章的知识内容与结构. 西瓜书第一章思维导图 基本概念 在学习机器学习之前,首先要搞清 ...
- 机器学习中的基本概念
基本概念有: 训练集,测试集,特征向量,概念学习,监督学习,非监督学习,半监督学习,分类,回归 训练集:用来进行训练,也就是产生模型或者算法的数据集 测试集:用来专门进行测试已经学习好的模型或者算法的 ...
- 统计机器学习中的一些概念
目录 最大似然估计 熵,交叉熵,KL散度 变分推理 example 1:边缘分布难以计算 example 2:后验概率正比于联合分布 使用简单的分布近似复杂的后验概率分布 实例理解 最大似然估计 假设 ...
- 复习01统计学习方法(机器学习中的重要概念)---图片版
- 机器学习中常用的基本概念
目录 1. 机器学习定义 2. 机器学习中的属性与特征 3.误差 4.过拟合与欠拟合 4.1 过拟合 4.2欠拟合 5.交叉验证 5.1交叉验证基本思想 5.2 交叉验证训练过程 6.调参 7. 机器 ...
- 机器学习中的特征是什么?机器学习知识点详解
在机器学习中,特征(feature)指的是描述一个实例的属性或特征,也可以称为自变量(independent variable)或输入变量(input variable).特征是机器学习中非常重要的概 ...
- AI:人工智能概念之机器学习中常用算法的思维导图集合(非常经典、建议收藏)之详细攻略
AI:人工智能概念之机器学习中常用算法的思维导图集合(非常经典.建议收藏)之详细攻略 目录 机器学习算法的思维导图集合 1.ML算法思维图 2.ML算法思维导图 相关文章:ML/DL:关于算法模型的选 ...
- 机器学习中Batch Size、Iteration和Epoch的概念
机器学习中Batch Size.Iteration和Epoch的概念 Epoch一个epoch指代所有的数据送入网络中完成一次前向计算及反向传播的过程.由于一个epoch常常太大,计算机无法负荷,我们 ...
- 机器学习中贝叶斯判决、概率分布、样本等概念间的关系
以下是在看模型识别,机器学习及数理统计时,对贝叶斯决策.概率分布.样本关系的总结,每想到一点就写下来,比较乱,这块需要反复学习.慢慢理解. 1. 机器学习的一些概念: 什么是机器学习? 机器学习包含哪 ...
最新文章
- java-在应用中获取spring定义的bean
- 敏捷项目管理任务卡片多选
- 基于JDK1.8---HashMap源码分析
- IBM收购Clearleap,提供云视频服务
- 2 自己编写:AppDelegate,CCApplication,CCApplicationProtocol
- java复选框没被选择,在CodenameOne中,为什么没有选中复选框但显示为选中状态?...
- commons-lang3工具类学习(二)
- 软考一般知识之数据库
- JSONOBject的fluentPut(key,value)方法:可链式设置元素
- WindowsServices_无法拷贝文件到服务器
- eclipse中怎么安装spring插件_安装eclipse中容易遇到的问题
- 模电里的时变信号直流信号交流信号字母大小写的规定
- springmvc国际化 基于请求的国际化配置
- 游戏测试就天天打游戏?老司机给你深度解惑
- ipad mini2 12.5.4成功降级 10.3.3
- php字符串函数(1)长度计算、查找、截取
- 太难了 | 2019年互联网寒冬,如何防止自己被裁员失业?
- 测试场景设计-登录设计
- 什么是生物特征识别?有哪些生物特征?
- 麒麟820和鸿蒙系统,网曝魅族正在适配麒麟820和鸿蒙系统,黄章:我怎么不知道...