有监督学习,无监督学习,强化学习总结
其中, 监督学习的主要特点是要在训练模型时提供给学习系统训
练样本以及样本对应的类别标签, 因此其又称为有导师学习。典型的监督学习方法有决策树、 支持向量机 (support vector machine, SVM) 、 监督式神经网络等分类算法和线性回归等回归算法。无监督学习方法主要特点是训练时只提供给学习系统训练样本, 而没有样本对应的类别标签信息。典型的无监督学习方法有聚类学习和自组织神经网络学习。强化学习方法的特点是通过试错 (try-and-error) 来发现最优行为策略, 而不是带有标签的样本学习。
投毒攻击(poisoningattack)主要是对机器学习在训练模型时需要的训练数据进行投毒,是一种破坏模型可用性和完整性的诱发型攻击。。攻击者通过注入一些精心伪造的恶意数据样本 (带有错误的标签和攻击的性质) , 破坏原有的训练数据的概率分布, 从而使训练出的模型的分类或者聚类精度降低,达到破坏训练模型的目的。由于实际中应用机器学习算法的系统的原始训练数据大多是保密的, 一般不会被攻击者轻易修改, 但很多系统为了增强适应能力需要定期重新训练实现模型更新, 从而给了攻击者可趁之机。 自适应生物面部识别系统、恶意软件分类系统、 垃圾邮件检测系统等, 都需要定期重新训练。而对于实现投毒攻击的技术来说, 生成合适的对抗样本是投毒攻击能否成功实现的关键.
而一种比较常用的产生对抗样本的方法—— 梯度下降策略(gradient ascentstrategy), 通过对度量样本对抗性能的目标函数梯度的计算, 进而产生满足要求的最优对抗样本, 在对SVM、 LASSO算法以及PDF中的恶意程序检测系统的投毒攻击中均有使用最新的研究提出了一种更有效的产生对抗样本的方法, 它采用生成对抗网络 (generative adversarial network, GAN) 中生成模型generative model) 和判别模型 (discriminative model)的思想, 即先用生成模型产生候选的对抗样本, 再用判别模型筛选最优对抗样本。该方法与一般的直接梯度法 (direct gradient) 在 MNIST 和 CIFAR-10 两个数据集上的实验结果对比可知, GAN产生对抗样本的速度更快, 识别准确率 (accuracy) 更低, 损失值 (loss)更大。同时, GAN也可以产生针对恶意软件分类器的对抗样本.
除了训练过程, 在机器学习的测试/推理过程中也存在着很多安全性问题, 给系统造成很大的安全性威胁。测试/推理过程主要指通过训练出的模型来对新数据进行分类或者聚类的过程, 是机器学习模型发挥作用的阶段
有监督学习,无监督学习,强化学习总结相关推荐
- AI:人工智能领域算法思维导图集合之有监督学习/无监督学习/强化学习类型的具体算法简介(预测函数/优化目标/求解算法)、分类/回归/聚类/降维算法模型选择思路、11类机器学习算法详细分类之详细攻略
AI:人工智能领域算法思维导图集合之有监督学习/无监督学习/强化学习类型的具体算法简介(预测函数/优化目标/求解算法).分类/回归/聚类/降维算法模型选择思路.11类机器学习算法详细分类(决策树/贝叶 ...
- 机器学习的五大分类,监督学习 无监督学习 半监督学习 迁移学习 增强学习
机器学习的五大分类,监督学习 无监督学习 半监督学习 迁移学习 增强学习@监督学习 无监督学习 半监督学习 监督学习 在监督学习中,给定一组数据,我们知道正确的输出结果应该是什么样子,并且知道在输入和 ...
- 监督学习无监督学习_无监督学习简介
监督学习无监督学习 To begin with, we should know that machine primarily consists of four major domain. 首先,我们应 ...
- 基于深度强化学习的机器人运动控制研究进展 | 无模型强化学习 | 元学习
1.基于深度强化学习的机器人运动控制研究进展 1.1 深度强化学习 1.1.1 强化学习简介: 强化学习(Reinforcement Learning, RL)利用试错机制与环境进行交互,旨在通过最大 ...
- 第一周-机器学习监督学习-无监督学习
这仅是本人在cousera上学习机器学习的笔记,不能保证其正确性,谨慎参考 关系图: 监督学习(Supervised Learning): 回归预测(Regression:predict real-v ...
- Supervised learning/ Unsupervised learning监督学习/无监督学习
[机器学习]两种方法--监督学习和无监督学习(通俗理解) [机器学习] : 监督学习 (框架) 有监督学习与无监督学习的几大区别 目录 Supervised learning 监督学习 Unsuper ...
- 吴恩达机器学习(二)监督学习/无监督学习
文章目录 1.监督学习 2.无监督学习 1.监督学习 定义: 根据已有的数据集,知道输入和输出结果之间的关系.根据这种已知的关系,训练得到一个最优的模型.也就是说,在监督学习中训练数据既有特征(fea ...
- 无梯度强化学习:使用Numpy进行神经进化
作者|Jacob Gursky 编译|VK 来源|Towards Data Science 介绍 如果我告诉你训练神经网络不需要计算梯度,只需要前项传播你会怎么样?这就是神经进化的魔力!同时,我要展示 ...
- 论文笔记-连续HVAC控制的无模型强化学习算法的实验评估
本文在一个模拟的数据中心中对四种actor-critic算法进行了实验评估.性能评估基于它们在提高能效的同时保持热稳定性的能力,以及它们对天气动态的适应性.与在EnergyPlus中实施的基于模型的控 ...
- 【零基础学机器学习 3】机器学习类型简介:监督学习 - 无监督学习 - 强化学习
最新文章
- 2020高速公路shp文件_全国按轴收费方案最终版!今天起,高速公路就按照这个标准收费...
- 【FTP】FTP 命令模式下 PASV OR PORT
- 学习笔记(六)——JavaScript(三)
- php 版本排序,四种常见排序算法--PHP版本
- nssl1230-序列【位运算】
- jsp 的 for循环
- http库cookiejar模块
- 虚方法(virsual method)
- 矜情作态的拼音及解释
- 解决XP IIS(HTTP 500内部服务器错误)
- 7z001怎么解压在安卓手机上面_安卓手机怎么设置网易企业邮箱
- 攻防世界-Misc-gif
- LE SHAN GIANT BUDDHA and LINGYUN TEMPLE
- redis 安装填坑记录
- 平安银行股票数据涨跌预测
- 悬崖帝国中文版下载|悬崖帝国中文破解版下载 v1.0绿色免安装版
- 软件设计师 2022年上半年下午题
- linux解压缩命令 gz,linux的gz解压缩命令是什么
- ArcGIS提取面数据中心线
- enjoy 问候相关
热门文章
- UWP 全屏与退出全屏
- Can‘t update has no tracked branch
- 中文维基百科语料库 训练好的Word2vec模型
- matlab数字转换罗马数字,罗马数字(1到1000) 1到1000的叠加是多少
- 8个PNG素材网站,每一个都让你觉得人生发亮
- 聚合支付系统的设计与实现
- 如何网络监测其他计算机关闭445端口,关闭445端口方法 包括XP win7和win10系统(超详细)...
- 云计算机房架构图,云计算架构技术与实践
- Swift学习笔记 -- 枚举和结构
- php抽奖简单源码,php转盘抽奖 完整例子源码(含模拟数据)