有监督学习，无监督学习，强化学习总结

其中， 监督学习的主要特点是要在训练模型时提供给学习系统训
练样本以及样本对应的类别标签，因此其又称为有导师学习。典型的监督学习方法有决策树、支持向量机（support vector machine， SVM）、监督式神经网络等分类算法和线性回归等回归算法。无监督学习方法主要特点是训练时只提供给学习系统训练样本，而没有样本对应的类别标签信息。典型的无监督学习方法有聚类学习和自组织神经网络学习。强化学习方法的特点是通过试错（try-and-error）来发现最优行为策略，而不是带有标签的样本学习。

投毒攻击（poisoningattack）主要是对机器学习在训练模型时需要的训练数据进行投毒，是一种破坏模型可用性和完整性的诱发型攻击。。攻击者通过注入一些精心伪造的恶意数据样本（带有错误的标签和攻击的性质），破坏原有的训练数据的概率分布，从而使训练出的模型的分类或者聚类精度降低，达到破坏训练模型的目的。由于实际中应用机器学习算法的系统的原始训练数据大多是保密的，一般不会被攻击者轻易修改，但很多系统为了增强适应能力需要定期重新训练实现模型更新，从而给了攻击者可趁之机。自适应生物面部识别系统、恶意软件分类系统、垃圾邮件检测系统等，都需要定期重新训练。而对于实现投毒攻击的技术来说，生成合适的对抗样本是投毒攻击能否成功实现的关键.

而一种比较常用的产生对抗样本的方法—— 梯度下降策略（gradient ascentstrategy），通过对度量样本对抗性能的目标函数梯度的计算，进而产生满足要求的最优对抗样本，在对SVM、 LASSO算法以及PDF中的恶意程序检测系统的投毒攻击中均有使用最新的研究提出了一种更有效的产生对抗样本的方法，它采用生成对抗网络 （generative adversarial network， GAN）中生成模型generative model）和判别模型（discriminative model）的思想，即先用生成模型产生候选的对抗样本，再用判别模型筛选最优对抗样本。该方法与一般的直接梯度法（direct gradient）在 MNIST 和 CIFAR-10 两个数据集上的实验结果对比可知， GAN产生对抗样本的速度更快，识别准确率（accuracy）更低，损失值（loss）更大。同时， GAN也可以产生针对恶意软件分类器的对抗样本.

除了训练过程，在机器学习的测试/推理过程中也存在着很多安全性问题，给系统造成很大的安全性威胁。测试/推理过程主要指通过训练出的模型来对新数据进行分类或者聚类的过程，是机器学习模型发挥作用的阶段

有监督学习，无监督学习，强化学习总结相关推荐

AI：人工智能领域算法思维导图集合之有监督学习/无监督学习/强化学习类型的具体算法简介(预测函数/优化目标/求解算法)、分类/回归/聚类/降维算法模型选择思路、11类机器学习算法详细分类之详细攻略
AI:人工智能领域算法思维导图集合之有监督学习/无监督学习/强化学习类型的具体算法简介(预测函数/优化目标/求解算法).分类/回归/聚类/降维算法模型选择思路.11类机器学习算法详细分类(决策树/贝叶 ...
机器学习的五大分类，监督学习无监督学习半监督学习迁移学习增强学习
机器学习的五大分类,监督学习无监督学习半监督学习迁移学习增强学习@监督学习无监督学习半监督学习监督学习在监督学习中,给定一组数据,我们知道正确的输出结果应该是什么样子,并且知道在输入和 ...
监督学习无监督学习_无监督学习简介
监督学习无监督学习 To begin with, we should know that machine primarily consists of four major domain. 首先,我们应 ...
基于深度强化学习的机器人运动控制研究进展 | 无模型强化学习 | 元学习
1.基于深度强化学习的机器人运动控制研究进展 1.1 深度强化学习 1.1.1 强化学习简介: 强化学习(Reinforcement Learning, RL)利用试错机制与环境进行交互,旨在通过最大 ...
第一周-机器学习监督学习-无监督学习
这仅是本人在cousera上学习机器学习的笔记,不能保证其正确性,谨慎参考关系图: 监督学习(Supervised Learning): 回归预测(Regression:predict real-v ...
Supervised learning/ Unsupervised learning监督学习/无监督学习
[机器学习]两种方法--监督学习和无监督学习(通俗理解) [机器学习] : 监督学习 (框架) 有监督学习与无监督学习的几大区别目录 Supervised learning 监督学习 Unsuper ...
吴恩达机器学习（二）监督学习/无监督学习
文章目录 1.监督学习 2.无监督学习 1.监督学习定义: 根据已有的数据集,知道输入和输出结果之间的关系.根据这种已知的关系,训练得到一个最优的模型.也就是说,在监督学习中训练数据既有特征(fea ...
无梯度强化学习：使用Numpy进行神经进化
作者|Jacob Gursky 编译|VK 来源|Towards Data Science 介绍如果我告诉你训练神经网络不需要计算梯度,只需要前项传播你会怎么样?这就是神经进化的魔力!同时,我要展示 ...
论文笔记-连续HVAC控制的无模型强化学习算法的实验评估
本文在一个模拟的数据中心中对四种actor-critic算法进行了实验评估.性能评估基于它们在提高能效的同时保持热稳定性的能力,以及它们对天气动态的适应性.与在EnergyPlus中实施的基于模型的控 ...
【零基础学机器学习 3】机器学习类型简介：监督学习 - 无监督学习 - 强化学习

有监督学习，无监督学习，强化学习总结

有监督学习，无监督学习，强化学习总结相关推荐

最新文章

热门文章