机器学习review

Paper:Machine Learning: A Review of Learning Types
这是一篇关于机器学习的综述,里面简述了各种现有的机器学习技术。

1 主要的方法:监督、无监督、强化

1.1 监督学习

数据格式:特征 + 标签
学习目标:到从输入到输出的映射函数
根据输出变量划分,监督学习又可以分为分类和回归
分类:输出结果是离散的、可列的,如水果种类、手写字体识别。
回归:输出结果是连续的,如价格、温度-气压曲线

1.2 无监督学习

数据格式:特征
目标:尝试根据输入的数据建立模型,发现数据的潜在特性
无监督的代表是聚类——一种挖掘数据内部结构的技术。

举个栗子:我有10个样本,要把它们分成A、B、C共3类(集群);
如下图,每个类内部的样本其相似性较大,类之间相似性较小。
相似性度量可用空间距离、欧氏距离,度量方法不同会产生不同的聚类结果。

K-means算法例子:乘客分群,区分高价值客户、无价值客户等

1.3 强化学习

强化学习是这样一个过程:一个agent在一系列任务中1)观察环境状态2)做出反应(或行为或决策)3)获得惩罚或者奖励4) 调整自己的行为不断重复上述过程,最终目标是最大化它的最终奖励。

调整方式:如果Agent的某个行为策略导致环境正的奖赏(强化信号),那么Agent以后产生这个行为策略的趋势便会加强。
强化学习例子——王者荣耀中的机器人。

Overview of reinforcement learning. An agent observes
the environment state and performs actions to maximize an overall
reward.

2 混合方法

2.1 半监督学习(semi-surpervised learning)

顾名思义,半监督是监督学习和无监督学习的中间状态,算法使用带标记和不带标记数据的组合来训练模型。
常见的方法是,少量标签数据和大量未标记数据的组合,先使用无监督学习算法进行聚类,根据聚类结果,可对未标记数据进行标记,然后就可以使用监督学习算法训练数据。
许多半监督学习算法的成功很大程度上取决于以下假设的有效性:未标记和标记的数据具有相同的分布
Overview of semi-supervised learning

2.2 自监督学习(self-surpervised learning)

自监督是无监督的一种形式。初始时,数据没有任何标记,通过不断地挖掘,从而发现数据的内在联系,形成监督信息

This is done in an unsupervised manner by forcing the network to learn
semantic representation about the data. Knowledge is then transferred to the model for the main task.

2.3自我学习(self-taught learning)

自学习与半监督学习类似,也使用未标记的数据,试图在已标记数据有限的情况下,提高监督学习的性能。但,自学习允许标记数据与未标记数据拥有不同的分布,甚至不用遵循同分类,所以在实际应用中,自学习使用更加广泛。

自上而下:监督分类使用大象和犀牛的标记示例;半监督学习使用大象和犀牛的附加未标记示例;转移学习使用其他类型标记的数据集;自学只需要额外的未标记图像,例如从互联网上随机下载的图像。

自学习的问题是,如何通过无监督学习从未标记数据中学习知识,这些知识是什么,然后如何将这些知识迁移到监督学习的任务中。
更多参考:Self-taught learning: transfer learning from unlabeled data
.

3 其他常用方法

3.1 多任务学习(Multi-task Learning)

MTL的灵感来源于人类的学习活动,人们通常将以前任务中学到的知识,应用于在新的任务中学习其他的知识。这里“以前的任务”应是相互关联的。比如小学生写文章,老师先会教他们认字、写字、学词、造句、标点…

3.2 主动学习(active learning)

“学习模块”和“选择策略”是主动学习算法的2个基本且重要的模块。

主动学习过程:“学习模块” 先对少量标记数据进行训练,根据此次训练结果,从未标记数据中选择想要标记的数据,人类专家标记,再把新标记的数据加入训练数据中。不断重复直到学习到模型达到某种标准。

3.3 在线学习(online learning)

准确地说,Online Learning并不是一种模型,而是一种模型的训练方法,Online Learning能够根据线上反馈数据,实时快速地进行模型调整,使得模型及时反映线上的变化,提高线上预测的准确率。Online Learning的流程包括:将模型的预测结果展现给用户,然后收集用户的反馈数据,再用来训练模型,形成闭环的系统。

3.3.1 增量学习(incremental learning)

增量学习思想可以描述为:每当新增数据时,并不需要重建所有的知识库,而是在原有知识库的基础上,仅对由于新增数据所引起的变化进行更新。我们发现,增量学习方法更加符合人的思维原理。

3.3.2 序列学习(sequence learning)

3.4 迁移学习(transfer learning)

3.5 联盟学习(federated learning)

3.6 集成学习(ensemble learning)

3.7 对抗性学习(adversarial learning)

3.8 元学习法(meta learning)

Targeted Learning

Multi-modal Learning

Bayesian Learning

deep learning

机器学习综述论文笔记:Machine Learning: A Review of Learning Types相关推荐

  1. Deep Learning论文笔记之(八)Deep Learning最新综述

    Deep Learning论文笔记之(八)Deep Learning最新综述 zouxy09@qq.com http://blog.csdn.net/zouxy09 自己平时看了一些论文,但老感觉看完 ...

  2. 论文笔记:《DeepGBM: A Deep Learning Framework Distilled by GBDT for Online Prediction Tasks》

    论文笔记:<DeepGBM: A Deep Learning Framework Distilled by GBDT for Online Prediction Tasks> 摘要 1. ...

  3. 论文笔记:Meta-attention for ViT-backed Continual Learning CVPR 2022

    论文笔记:Meta-attention for ViT-backed Continual Learning CVPR 2022 论文介绍 论文地址以及参考资料 Transformer 回顾 Self- ...

  4. 【time series】时间序列领域的Transformer综述论文笔记

    论文名称:Transformers in Time Series: A Survey 论文年份:2022/5/7 论文作者:阿里巴巴达摩院 论文下载:https://arxiv.org/abs/220 ...

  5. 论文笔记VITAL: VIsual Tracking via Adversarial Learning

    论文笔记VITAL: VIsual Tracking via Adversarial Learning 1. 论文标题及来源 2. 拟解决问题 3. 解决方法 3.1 算法流程 4. 实验结果 4.1 ...

  6. 论文笔记——Fair Resource Allocation in Federated Learning

    论文笔记--Fair Resource Allocation in Federated Learning 原文论文链接--http://www.360doc.com/content/20/0501/1 ...

  7. Multimodal Machine Learning: A Survey and Taxonomy多模态综述论文笔记

    文章目录 第一遍:快速预览,把握概要 1. 仔细阅读标题.摘要和简介. 1 INTRODUCTION 2. 先忽略内容,读一读文章中的每个小标题. 3. 如果有数学内容,先大致浏览,确定其理论基础. ...

  8. 【时序】应用于时间序列的 Transformer 综述论文笔记

    论文名称:Transformers in Time Series: A Survey 论文下载:https://arxiv.org/abs/2202.07125 论文源码:https://github ...

  9. 论文笔记(十六):Learning to Walk in Minutes Using Massively Parallel Deep Reinforcement Learning

    Learning to Walk in Minutes Using Massively Parallel Deep Reinforcement Learning 文章概括 摘要 1 介绍 2 大规模并 ...

  10. 深度强化学习综述论文 A Brief Survey of Deep Reinforcement Learning

    A Brief Survey of Deep Reinforcement Learning 深度强化学习的简要概述 作者: Kai Arulkumaran, Marc Peter Deisenroth ...

最新文章

  1. Ubuntu升级后apache所有的失败,以解决虚拟文件夹的设置
  2. Dagger依赖注入注解的具体作用
  3. python 命令-python 处理命令行参数
  4. Linux 技术篇-使用vim命令创建、编辑文件内容实例演示,linux修改文档方法
  5. 百雀羚、林清轩、逐本走红背后,植物基护肤品的春天来了?
  6. java订单超时取消设计_quartz框架和关闭超时订单
  7. android 异步回调中操作UI线程,UI同步、卡死阻塞等性能问题
  8. java获取前端json数据_java如何获取前端ajax传来的json对象
  9. mysql 5.1 for linux_linux下安装mysql5.1.68
  10. 061 实例15-霍兰德人格分析雷达图
  11. 2.5 分类模型评估指标—AUC与ROC及绘制混淆矩阵与ROC曲线
  12. m4a格式怎么转换成mp3,非常简单
  13. win 10 输入法自定义切换快捷键(rime)
  14. 2022年软件测试行业的现状和前景?
  15. 捕获SQLIntegrityConstraintViolationException
  16. signature=1c1223d10236c18f125cb9f7a490588e,Microscaled proteogenomic methods for precision oncology
  17. 【Get深一度】dB、dBm、dBW和W换分别代表的含义及换算关系
  18. [译] 苹果公司如何弯道超车颠覆传统瑞士制表业
  19. 如何联系CSDN客服
  20. C++核心编程4— 类和对象

热门文章

  1. PR13.0 2019 导入图片仅显示部分解决方法
  2. Android事件分发理解
  3. NLP系列——(2)特征提取
  4. 液压传动与气动技术【2】
  5. 用优盘装系统看不到计算机本身的硬盘,如果U盘安装系统找不到硬盘怎么办
  6. 国家医保移动支付国密算法SM2签名验签、SM4加解密测试工具
  7. log4j2日志配置颜色
  8. ValueError: operands could not be broadcast together with remapped shapes 解决方法
  9. netware php_在NetWare上搭建MySQL数据库_MySQL
  10. 夜曲歌词 拼音_《夜曲 - (原唱:周杰伦)》歌词 《夜曲 - (原唱:周杰伦)》LRC歌词?...