来源:Deephub Imba本文约2000字,建议阅读5分钟
本文为你介绍了子监督学习的三大领域的现状。

机器学习大致分为监督、无监督、半监督和强化学习问题。机器学习通过解决监督学习问题获得了大部分成功。监督学习通过学习任务中被标记的数据,为最先进的模型提供了更多的性能提升机会。

近几年,通过监督学习进行的深度学习也取得了巨大的成功。从图像分类到语言翻译,它们的性能一直在提高。然而在一些领域(例如罕见疾病的医疗数据集)中,收集大型标记数据集是昂贵且不可能的。这些类型的数据集为自监督算法提供了充足的机会,以进一步提高预测模型的性能。

自监督学习旨在从未标记的数据中学习信息表示。在这种情况下,标记数据集比未标记数据集相对小。自监督学习使用这些未标记的数据并执行前置任务(pretext tasks )和对比学习。

Jeremey Howard 在一篇关于自监督学习的优秀文章中将监督学习定义为两个阶段:“我们用于预训练的任务被称为前置任务。我们随后用于微调的任务称为下游任务”。自监督学习的例子包括未来词预测、掩码词预测修复、着色和超分辨率。

计算机视觉的自监督学习

自监督学习方法依赖于数据的空间和语义结构。对于图像,空间结构学习是极其重要的。包括旋转、拼接和着色在内的不同技术被用作从图像中学习表征的前置任务。对于着色,将灰度照片作为输入并生成照片的彩色版本。zhang等人的论文[1] 解释了产生生动逼真的着色的着色过程。

另一种广泛用于计算机视觉自监督学习的方法是放置图像块。一个例子包括 Doersch 等人的论文 [2]。在这项工作中,提供了一个大型未标记的图像数据集,并从中提取了随机的图像块对。在初始步骤之后,卷积神经网络预测第二个图像块相对于第一个图像块的位置。图 2 说明了该过程。

还有其他不同的方法用于自监督学习,包括修复和判断分类错误的图像。如果对此主题感兴趣,请查看参考文献 [3]。它提供了有关上述主题的文献综述。

自然语言处理的自监督学习

在自然语言处理任务中,自监督学习方法是最常见的。Word2Vec论文中的“连续词袋”方法是自监督学习最著名的例子。

类似地,还有其他不同的用于自监督学习的方法,包括相邻词预测、相邻句子预测、自回归语言建模和掩码语言建模。掩码语言建模公式已在 BERT、RoBERTa 和 ALBERT 论文中使用。

文本自监督学习的最新例子包括 Zhang 等人的论文 [4]。作者提出了一种间隔句生成机制。该机制用于总结摘要的下游任务。

表格数据的自监督学习

对图像和文本的自监督学习一直在进步。但现有的自监督方法对表格数据无效。表格数据没有空间关系或语义结构,因此现有的依赖空间和语义结构的技术是没有用的。

大多数表格数据都涉及分类特征,而这些特征不具有有意义的凸组合。即使对于连续变量,也不能保证数据流形是凸的。但是这一挑战为研究人员提供了一个新的研究方向。我将简要说明在这方面所做的一些工作。

Vincent 等人所做的工作 [5] 提出了一种去噪自动编码器的机制。前置任务是从损坏的样本中恢复原始样本。在另一篇论文中,Pathak 等人 [6] 提出了一种上下文编码器,从损坏的样本和掩码向量中重建原始样本。

Tabnet [7] 和 TaBERT [8] 的研究也是朝着自监督学习的渐进式工作。在这两项研究中,前置任务是恢复损坏的表格数据。TabNet 专注于注意力机制,并在每一步选择特征进行推理,TABERT 则是学习自然语言句子和半结构化表格的表示。

最近的一项工作 (VIME) [9] 提出了一种新的前置任务,可以使用一种新的损坏样本生成技术来恢复掩码向量和原始样本。作者还提出了一种新的表格数据增强机制,可以结合对比学习来扩展表格数据的监督学习。这里的输入样本是从未标记的数据集生成的”。

总结

自监督学习是深度学习的新常态。图像和文本数据的自监督学习技术令人惊叹,因为它们分别依赖于空间和顺序相关性。但是,表格数据中没有通用的相关结构。这使得表格数据的自监督学习更具挑战性。

引用

[1] Richard Zhang, Phillip Isola, and Alexei A. Efros, Colorful image colorization (2016), In European conference on computer vision

[2] Carl Doersch, Abhinav Gupta, and Alexei A. Efros, Unsupervised visual representation learning by context prediction (2015), In Proceedings of the IEEE international conference on computer vision

[3] Longlong Jing, and Yingli Tian, Self-supervised visual feature learning with deep neural networks: A survey (2020), IEEE transactions on pattern analysis and machine intelligence

[4] Jingqing Zhang, Yao Zhao, Mohammad Saleh, and Peter Liu, Pegasus: Pre-training with extracted gap-sentences for abstractive summarization (2020), In International Conference on Machine Learning

[5] Pascal Vincent, Hugo Larochelle, Yoshua Bengio, and Pierre-Antoine Manzagol, Extracting and composing robust features with denoising autoencoders (2008), In Proceedings of the 25th international conference on Machine learning

[6] Deepak Pathak, Philipp Krahenbuhl, Jeff Donahue, Trevor Darrell, and Alexei A. Efros, Context encoders: Feature learning by inpainting (2016), In Proceedings of the IEEE conference on computer vision and pattern recognition

[7] Sercan Ö. Arik, and Tomas Pfister, Tabnet: Attentive interpretable tabular learning (2021), In Proceedings of the AAAI Conference on Artificial Intelligence

[8] Pengcheng Yin, Graham Neubig, Wen-tau Yih, and Sebastian Riedel, TaBERT: Pretraining for Joint Understanding of Textual and Tabular Data (2020), In Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics

[9] Jinsung Yoon, Yao Zhang, James Jordon, and Mihaela van der Schaar, Vime: Extending the success of self-and semi-supervised learning to tabular domain (2020), Advances in Neural Information Processing Systems

编辑:王菁

校对:林亦霖

自监督学习简介以及在三大领域中现状相关推荐

  1. [当人工智能遇上安全] 3.安全领域中的机器学习及机器学习恶意请求识别案例分享

    您或许知道,作者后续分享网络安全的文章会越来越少.但如果您想学习人工智能和安全结合的应用,您就有福利了,作者将重新打造一个<当人工智能遇上安全>系列博客,详细介绍人工智能与安全相关的论文. ...

  2. 1 监督学习与非监督学习简介--机器学习基础理论入门

    1 监督学习与非监督学习简介–机器学习基础理论入门 1.1 机器学习基本概念 什么是机器学习 机器学习: 机器学习(machine learning,ML)是一门多领域交叉学科,设计概率论.统计学.逼 ...

  3. 深度长文 | 详细归纳NLP领域中的巨人肩膀

    来源:PaperWeekly 本文约13600字,建议阅读10+分钟. 本文为你分析当下NLP 当中可能的"巨人肩膀"在哪里,有哪些已经造好的"梯子"可供攀登. ...

  4. 二十三.基于机器学习的恶意请求识别及安全领域中的机器学习

    这是作者的系列网络安全自学教程,主要是关于网安工具和实践操作的在线笔记,特分享出来与博友共勉,希望您们喜欢,一起进步.前文分享了Web渗透的第一步工作,涉及网站信息.域名信息.端口信息.敏感信息及指纹 ...

  5. 信息系统开发与实践课现状调研 批发零售领域中的信息系统实践现状调研 大学编程作业(TUST 天津科技大学 2023年)

    信息系统开发与实践课现状调研 批发零售领域中的信息系统实践现状调研 大学编程作业(TUST 天津科技大学 2023 年) 信息系统开发与实践课现状调研 批发零售领域中的信息系统实践现状调研 大学编程作 ...

  6. CV领域中的Bert,了解一下?

    视学算法报道 转载自:机器之心 编辑:陈萍 Facebook AI 用 10 亿张来自Instagram的随机.未标注图像预训练了一个参数量达 13 亿的自监督模型 SEER,该模型取得了自监督视觉模 ...

  7. 医疗领域中的AI/ML机会前景

    简介 尽管有数百个项目和数千位数据科学家致力于将AI / ML引入医疗保健领域,但采用率仍然很低且缓慢. 1. 药物研发 医疗领域的所有AI / ML机会中,这一机会实际上是最遥远的. 主要原因是由大 ...

  8. 人工智能是什么?带你一次掌握人工智能的三大重点及三大领域

    http://blog.itpub.net/29829936/viewspace-2641916/ 目前仍有很多人还不太了解人工智能到底是什么,而今天笔者就要带着大家一起认识人工智能的关键技术与概念, ...

  9. uci数据集_干货收藏!三大领域常用十大开源数据集

    全文共1144字,预计学习时长2分钟 机器学习的研究与实现离不开大数据.知晓通用的开源数据集,一方面可以验证自己算法,另一方面也可以与其他算法进行比较.本文介绍了计算机视觉.自然语言处理和语音识别三大 ...

最新文章

  1. directshow+opencv显示usb的摄像头代码(并保存视频中的图片)
  2. js方式调用php_js如何调用php函数
  3. java中延迟_Java中的延迟分配
  4. 多核分布式队列的实现:“偷”与“自私”的运用(1)
  5. 本实例演示往TreeSet集合中存储自定义对象
  6. delphi 发送网络消息_Actor 消息的可靠交付(Akka Typed)
  7. Centos下安装JDK环境配置
  8. html转word设置一二三级标题,word怎么设置一二三级标题
  9. 网页中MP4视频格式要求
  10. 【8086汇编】输入一个整数,判断其奇偶性(输入范围:-32768~32767,含提示信息)
  11. 积分商城系统积分兑换运营开源架构
  12. 2021年湖北省区块链技术应用创新创业大赛已正式启动,欢迎报名参赛
  13. ZPanel-开源免费的虚拟主机在线管理系统
  14. android最早的版本,光遇最早版本
  15. 胡子决定编程语言运势
  16. 修改数据库单参数对应的值 前端+php
  17. 确定sw1开关信号输入端口_MEMS光学器件— MEMS OXC(光交叉互连开关)
  18. 电脑端知乎不显示图片
  19. 远程开机:一个简单的嵌入式项目开发
  20. CFS调度时间片计算

热门文章

  1. 定义一个员工类(JAVA)
  2. 记一次数组工具类 交集,去重
  3. $portfolio.isotope is not a function
  4. 云计算:存储之后,IT江湖之上的新大佬
  5. 深入实践Spring Boot2.3.2 文档建模
  6. java抓取网页或者文件的邮箱号码
  7. Atitit qzone qq空间博客自动点赞与评论工具的设计与实现
  8. Play自动生成的项目目录简介
  9. samba+quota配置
  10. Lock/Unlock Account - Active Directory