预训练模型的理解

  • 什么是预训练
  • 预训练的思想
  • CV领域的预训练

什么是预训练

“预训练“的做法一般是将大量低成本收集的训练数据放在一起,经过某种预训方法去学习其中的共性,然后将其中的共性“移植”到特定任务的模型中,再使用相关特定领域的少量标注数据进行“微调”,这样的话,模型只需要从”共性“出发,去“学习”该特定任务的“特殊”部分即可。

预训练的思想

预训练的思想是:模型的参数不再是随机初始化的,而是通过一些任务进行预先训练,得到一套模型参数,然后用这套参数对模型进行初始化,再进行训练

CV领域的预训练

首先对于CV领域图片分类任务,常用的深度学习模型是卷积视神经网络,对于多层的卷积神经网络来说,不同的层学到的特征是不同的,为了捕获更多的特征,浅层的感受野较小,所以浅层学到的特征往往是更加通用的,包含更多的像素点的信息,比如一些细粒度的信息:颜色、纹理、边缘等。
通常在大规模图片数据上预先获得‘通用特征’,然后再去做下游任务:

怎么理解预训练模型?相关推荐

  1. BERT的通俗理解 预训练模型 微调

    1.预训练模型       BERT是一个预训练的模型,那么什么是预训练呢?举例子进行简单的介绍       假设已有A训练集,先用A对网络进行预训练,在A任务上学会网络参数,然后保存以备后用,当来一 ...

  2. 赋能RPA时代,微软发布通用文档理解预训练模型LayoutLM

    来源:微软研究院AI头条 本文约3900字,建议阅读10+分钟 有效利用文档结构信息和视觉结构信息,显著提高模型准确率. 标签:自然语言处理 [ 导读 ]近年大热的机器人流程自动化(Robotic P ...

  3. 腾讯基于预训练模型的文本内容理解实践

    分享嘉宾:赵哲博士 腾讯 高级研究员 编辑整理:张书源 爱丁堡大学 出品平台:DataFunTalk 导读:预训练已经成为自然语言处理任务的重要组成部分,为大量自然语言处理任务带来了显著提升.本文将围 ...

  4. 《智源社区周刊:预训练模型》第2期:Facebook用“预微调”改进预训练性能、再议GPT-3中的东方主义偏见...

    超大规模预训练模型是当前人工智能领域研究的热点,为了帮助研究与工程人员了解这一领域的进展和资讯,智源社区整理了第2期<智源社区周刊:预训练模型>,从论文推荐.研究动态.热点讨论等几个维度推 ...

  5. 独家揭秘!史上最强中文NLP预训练模型 | 直播报名中

    编辑部 发自 凹非寺  量子位 报道 | 公众号 QbitAI 随着AI的快速发展,相信"深度学习"对大部分人来说已经不是一个陌生的概念了.通过深度学习,计算机能够在围棋.电子竞技 ...

  6. 超一流 | 从XLNet的多流机制看最新预训练模型的研究进展

    关注小夕并星标,解锁自然语言处理搜索.推荐与算法岗求职秘籍 文 | 老饕(某厂研究员,祖传调参) 美 | 人美心细小谨思密达 导读 作为 NLP 近两年来的当红炸子鸡,以 ELMo/BERT 为代表的 ...

  7. 智能文档理解:通用文档预训练模型

    预训练模型到底是什么,它是如何被应用在产品里,未来又有哪些机会和挑战? 预训练模型把迁移学习很好地用起来了,让我们感到眼前一亮.这和小孩子读书一样,一开始语文.数学.化学都学,读书.网上游戏等,在脑子 ...

  8. 刷新中文阅读理解水平,哈工大讯飞联合发布基于全词覆盖中文BERT预训练模型...

    作者 | HFL 来源 | 哈工大讯飞联合实验室(ID:rgznai100) 为了进一步促进中文自然语言处理的研究发展,哈工大讯飞联合实验室发布基于全词覆盖(Whole Word Masking)的中 ...

  9. 论文浅尝 | 如何利用外部知识提高预训练模型在阅读理解任务中的性能

    论文笔记整理:吴桐桐,东南大学博士生,研究方向为自然语言处理. 链接:https://www.aclweb.org/anthology/P19-1226/ 近年来,机器阅读理解已经逐渐发展为自然语言理 ...

最新文章

  1. Anaconda3-5.0.1 输入ipython 出现 ImportError: cannot import name ‘create_prompt_application‘
  2. java threetable,Java XWPFDocument.createTable方法代码示例
  3. 曹国伟:看准微博做大布局 哪怕革自己的命
  4. Spring学习总结(23)——Spring Framework 5.0 新特性
  5. sqlserver 事务日志过大 收缩方法解决方案
  6. Hvv近期0day总结五
  7. 扫描问题 无法识别计算机,我的扫描枪插进去显示无法识别怎么办
  8. 【考研数学】微分中值定理计算极限专题
  9. yang模型中rpc_RPC原理篇
  10. Java开发关键技术
  11. 10个团建小游戏备选方案
  12. HttpWebRequest.Create
  13. leetcode 1833 雪糕的最大数量
  14. 至2017年2月止SharePoint 2016 所有增加和更新内容。
  15. 一个简单的购物商城,记录一下。
  16. Python——函数返回值
  17. ppt讲解计算机的组成,计算机基础(基本组成篇)讲解.ppt
  18. ansible常用模块应用
  19. 6.18科技新闻(2)
  20. 03 计算机性能是用哪些指标来衡量的?

热门文章

  1. 小程序实现滚动加载(懒加载)
  2. uni-app开发微信小程序常见问题(更新版):uni.getUserProfile要怎么写?uni.login和uni.getUserProfile的顺序?
  3. 投资理财之基金一、初识基金
  4. 三维扫描系列 点云绪论
  5. 中文字符编码之GBK,UTF-16和UTF-8
  6. 计算机视觉需要学习哪些编程语言?
  7. Qt学习笔记(五):菜单栏
  8. [SQL]如何实现表数据的去重
  9. proteus元件大全 仿真元件 电子元器件英文缩写
  10. 【Android应用开发技术:用户界面】界面导航设计