Open-world Machine Learning: Applications, Challenges,and Opportunities || 阅读笔记
研究背景:传统的机器学习(主要是监督学习)遵循封闭世界学习的假设(将当前未知的事物都设为假的假设),对于他们每个测试类都有一个训练类可用。然而,这样的模型无法识别训练期间看不见的类(即看不见的类),开放世界机器学习(OWML)则处理看不见的类。
研究内容:first 概述OWML对现实世界的重要性;next 探索和讨论OWML的不同维度。本文对OWML的各种技术进行了系统评价;介绍了OWML的研究差距、挑战和未来方向。
研究意义:本文将帮助研究人员了解 OWML 的全面发展以及将研究扩展到合适领域的可能性。它还将有助于选择适用的方法和数据集以进一步探索这一点。
知识背景补充
开集识别简单定义是,一个在训练集上训练好的模型,当利用一个测试集(该测试集中包含训练集中没有的类别)进行测试时,如果输入已知类别数据,输出具体的类别,如果输入的是未知类别的数据,则进行合适的处理。
远离已知数据的空间(包括KKCs(具有明确标签的正训练样本)和KUCs(被标记为负样本,不必要被划分为一个具体的类别))通常被认为是开放空间 ,因此将该空间中的任何样本任意标注为KKC必然会带来风险,这被称为开放空间风险(open space risk)
此文结构
• Section 1 Introduction
• Section 2 介绍 OWML背景信息
• Section 3 解释本文采用的评审方法和 OWML的分类
• Section 4 介绍计算机视觉和图像处理 (CV-IP) 中 OWML的相关工作
• Section 5 介绍自然语言处理 (NLP) 中 OWML的相关工作
• Section 6 回顾了一些研究人员在 OWML 中使用的标准基准数据集
• Section 7 讨论OWML中使用的一些基线算法
• Section 8 讨论OWML的相关领域。解释 OWML 中的一些研究挑战和未来方向(第 9 节和第 10 节)
• Section 10 总结全文
1. Introduction
将示例识别为看不见或对其进行分类的能力称为开放世界学习。
然而,在现实世界的场景中,交互式和自动化应用程序在动态环境中工作,并且来自新类的数据会定期到达。在这种情况下,遵循封闭世界假设的模型无法解决这种情况。
OWML不限于特定的机器学习,可以在执行预期工作的同时学习以前没有学习过的新事物。换句话,我们可以说开放世界的机器学习可以让机器像普通人一样学习。
研究内容:首先,概述了OWML对现实世界的重要性。还介绍了计算机视觉和自然语言处理中使用的众多OWML方法的分类。此外,对现有作品进行了表格总结,强调了对优缺点的讨论。此外,讨论了OWML中用于计算机视觉和自然语言处理的一些基准算法。总结讨论有助于在给定的学习环境中为特定问题选择适当的方法。
此文的主要贡献:• 提出了一种基于任务的分类法,可以区分开放世界机器学习 (OWML) 的关键特征及其关系。 • 从效率和其他参数方面分析了几种技术及其特点。 • 讨论了 OWML 中用于计算机视觉和图像处理以及自然语言处理的各种数据集及其特征,以彻底了解结果。 • 简要介绍了各种研究空白和挑战,有助于将工作扩展到 OWML。 • 介绍了OWML 的一些相关领域,以通过不同的技术确定开放世界问题。
2. Background and Formal Definition
什么是open:在开放世界学习中,分类是开放的,或者模型可以增量学习。它可以了解新类并更新现有模型(无需重新训练)。开放世界机器学习也称为累积学习和开放世界识别 。(增量学习是指一个学习系统能不断地从新样本中学习新的知识,并能保存大部分以前已经学习到的知识。增量学习非常类似于人类自身的学习模式。因为人在成长过程中,每天学习和接收新的事物,学习是逐步进行的,而且,对已经学习到的知识,人类一般是不会遗忘的。)
开放世界机器学习使用seen数据进行训练,使用seen, seen-unseen, and unseen的数据进行测试,是唯一对不可见实例具有拒绝能力的方法。
开放世界机器学习使用可见数据进行训练,并对可见数据进行分类并拒绝不可见数据。
分类器的目标是将每个测试示例
Open-world Machine Learning: Applications, Challenges,and Opportunities || 阅读笔记相关推荐
- Paper reading (十八):Machine learning applications in genetics and genomics
论文题目:Machine learning applications in genetics and genomics scholar 引用:528 页数:12 发表时间:2015.05 发表刊物:n ...
- Why Machine Learning Strategy (Maching Learing Yearning 翻译笔记)
Why Machine Learning Strategy 为什么要是用机器学习策略? Machine learning is the foundation of countless importan ...
- 《Hands-On Machine Learning with Scikit-Learn TensorFlow》读书笔记(一):机器学习概述
最近有时间看书了,把以前想看的书捡一下,翻译中顺便加上自己的理解,写个读书笔记. 一.什么是机器学习? Machine Learning is the science (and art) of pro ...
- Titanic: Machine Learning from Disaster-kaggle入门赛-学习笔记
Titanic: Machine Learning from Disaster 对实验用的数据的认识,数据中的特殊点/离群点的分析和处理,特征工程(feature engineering)很重要. 注 ...
- Machine Learning In Action 第二章学习笔记: kNN算法
本文主要记录<Machine Learning In Action>中第二章的内容.书中以两个具体实例来介绍kNN(k nearest neighbors),分别是: 约会对象预测 手写数 ...
- 机器学习 Machine Learning中一元线性回归的学习笔记~
1 前言 今天在做 Machine Learning的作业~ 2 一元线性回归 2.1 loss函数 带有规范化的loss函数: J(θ)=12m∑i=1m(hθ(x(i))−y(i))2+λ2m∑j ...
- 机器学习 Machine Learning中多元线性回归的学习笔记~
1 前言 今天在做 Machine Learning中多元线性回归的作业~ 2 Machine Learning中多元线性回归 2.1 Feature Scaling和 Mean Normalizat ...
- q learning 参数_Soft Q-Learning论文阅读笔记
标题|作者 Reinforcement Learning with Deep Energy-Based Policies Tuomas Haarnoja, Haoran Tang, Pieter Ab ...
- 《Sequence to Sequence Learning with Neural Networks》阅读笔记
Abstract DNNs 可用于各种复杂的学习任务并取得很好的效果,但是 DNNs 不能用于序列到序列的映射.这篇论文提出了一种端到端(end-to-end)的神经网络模型,来学习这种映射关系.作者 ...
最新文章
- EasyUI Pagination 分页的两种做法
- 网站SEO秒收录对网站有哪些要求?
- 9.3 域名解析与网页爬虫
- R语言实战应用精讲50篇(三)-多重线性回归系列之模型评估与诊断应用案例
- MySql(windows)安装步骤整理
- h命令可以获取mysql客户端的帮助信息_如何获取MySQL帮助信息
- psql执行sql的方式及一些基本命令
- c语言怎样计算栈的长度,请问,用c语言做一个计算器 包括+-*/()的运算 用栈 该怎么做...
- Zabbix agent批量自动部署
- OpenCV:框选某一特定区域并保存到图片
- python selenium+pywin32 实现网页另存为
- CSRF和SSRF漏洞
- Qt多语言开发--Qt语言专家
- redis与数据库同步的解决方案
- vs2010 中文版发布及下载地址
- PS怎么把人物扣的更干净_PS抠图技巧
- xp系统关于无线网络连接服务器,八步骤搞定XP系统无线网络设置问题
- 加密世界“众生相”:僧侣、信徒和骗子
- eclipse性能调查工具tptp的使用方法
- CTF writeup -who are you?