一、概述

从任务的视角来看BERT的微调(Fine-tuning), 通过下游监督式学习的任务(设定预定义的标签)来对BERT预训练之后的网络进行微调,这里需要重点关注的是"Further Pre-training"部分和"Multi-Task Fine-tuning"部分。BERT在工作时是个分类器,无论针对的是单任务还是多任务,是聚焦于全局的信息([CLS])还是局部的信息(NER),BERT能够捕获领域通用的语义信息,从而能够更精细化地表达输入内容,在输出时使用vector或者matrix,所以很容易对输出结果进行处理,从而导致BERT可以和传统的机器学习算法相结合,把BERT作为整个训练或推理的一个阶段或者使用BERT作为上游的输入。从下图看,首先BERT会进行一个初步的训练,这个训练可能使用的是比较通用的数据集,然后使用领域相关的数据集进行进一步的训练,所以在前面训练的基础上进行了状态的更新,状态更新意味着MAP的运用,然后进入流水线式的单个任务或者多个任务的微调(Fine-tuning)的过程。

对于文本分类任务,BERT使用[CLS]最后产出的hidden state来表达整个语句的全局的信息,这是因为BERT网络的最后一层表达了更抽象的信息如语义级别的信息。在下面的公式里ÿ

Gavin老师Transformer直播课感悟 - BERT多任务Fine-tuning案例实战相关推荐

  1. Gavin老师Transformer直播课感悟 - 图解Rasa对话机器人项目实战之教育领域Education Bot项目及综合调试Debugging实战解密(七十七)

    本文继续围绕工业级业务对话平台和框架Rasa,对Rasa对话机器人项目实战之教育领域Education Bot项目的架构进行分析,并通过debug模式演示与分析Rasa Agent如何与核心组件NLU ...

  2. Gavin老师Transformer直播课感悟 - Rasa项目实战之银行金融Financial Bot智能业务对话机器人业务功能微服务解析与调试(八十九)

    本文继续围绕工业级业务对话平台和框架Rasa,对Rasa项目实战之银行金融Financial Bot智能业务对话机器人的主要业务功能所使用的微服务进行解析,并通过Rasa Interactive的调试 ...

  3. Gavin老师Transformer直播课感悟 - Rasa项目实战之电商零售智能业务对话机器人配置详解与Debugging演示(八十七)

    本文继续围绕工业级业务对话平台和框架Rasa,对Rasa项目实战之电商零售智能业务对话机器人系统所使用的各项配置进行详细剖析,并通过debug模式来理解在下面展示的Rasa graph archite ...

  4. Gavin老师Transformer直播课感悟 - Rasa项目实战之银行金融Financial Bot智能业务对话机器人业务功能微服务解析与调试(八十一)

    本文继续围绕工业级业务对话平台和框架Rasa,对Rasa项目实战之银行金融Financial Bot智能业务对话机器人的主要业务功能所使用的微服务进行解析,并通过Rasa Interactive的调试 ...

  5. Gavin老师Transformer直播课感悟 - NLP信息提取中的CRF Modeling详解

    一.概述 CRF的能力在于信息的依赖性和状态转移处理,它可以表达任意的状态转移和依赖关系.而信息表达能力不足则可以依靠Transformer来处理.在论文中的这幅图展示了各种模型之间是如何进行转换的, ...

  6. Gavin老师Transformer直播课感悟 - Rasa项目实战之银行金融Financial Bot智能业务对话机器人架构与流程及Rasa Interactive实验剖析(八十)

    本文继续围绕工业级业务对话平台和框架Rasa,对Rasa项目实战之银行金融Financial Bot智能业务对话机器人架构.流程进行解析,并通过Rasa Interactive分析配置文件中各个组件的 ...

  7. Gavin老师Transformer直播课感悟 - Rasa项目实战之电商零售对话机器人通过Rasa interactive进行问题修正与调试演示(八十四)

    本文继续围绕工业级业务对话平台和框架Rasa,对Rasa项目实战之电商零售Customer Service智能业务对话机器人通过Rasa Interactive的调试来定位NLU的问题,并通过交互式模 ...

  8. Gavin老师Transformer直播课感悟 - Rasa项目实战之电商零售智能业务对话机器人业务功能微服务解析与调试演示(八十二)

    本文继续围绕工业级业务对话平台和框架Rasa,对Rasa项目实战之电商零售Customer Service智能业务对话机器人主要业务功能所使用的微服务进行解析,并通过Rasa Interactive的 ...

  9. Gavin老师Transformer直播课感悟 - Rasa项目实战之电商零售智能业务对话机器人业务功能微服务解析与调试演示(八十三)

    本文继续围绕工业级业务对话平台和框架Rasa,对Rasa项目实战之电商零售Customer Service智能业务对话机器人业务功能的微服务如何结合数据库使用进行解析,并通过Rasa Interact ...

最新文章

  1. [翻译]一步步教你配置SQL SERVER合并复制(五)配置Publisher(上)
  2. OpenFlow Switch — 1.3 规范
  3. oracle最新scn补丁,更新:Oracle全面修正了关于DB Link和SCN补丁的公告
  4. taglib遍历foreach循环list集合
  5. Java内存模型深度解析:重排序 --转
  6. 2010 eWEEK 年度产品
  7. python中dict的fromkeys用法教程
  8. [云炬创业基础笔记]第七章创业资源测试6
  9. mysql自带客户端连接服务器,客户端连接mysql服务器的指令 mysql -u root -p 详细讲解及使用实例...
  10. 极限 lim(x^x-(sinx)^x)/(x²arctanx)
  11. ANDROID笔记:Activity之间的传值
  12. 各版本Anaconda的下载、安装和卸载(适用于Windows/Linux系统)
  13. java xml解析 jdom_Java XML解析工具 JDOM介绍及使用实例
  14. 无形胜有形——0day破解组织探秘
  15. java sasl例子_Java Subject.doAs方法代碼示例
  16. Spring单例模式的一次失败经历和总结
  17. spark idea报错:json standard allows only one-top level
  18. 华为平板电脑装linux系统,专为平板设计的Linux JingOS来了,神似iPadOS,已适配华为...
  19. 美就在你身边201209开学第一课
  20. boost库之geometry

热门文章

  1. 墨门云文件加密系统有哪些功能特点?
  2. python 安装失败 errorcode 2203_win10系统安装软件出现the error code is 2203错误怎么办...
  3. 海量数据大课学习笔记(2)-不在其位要谋其政,技术Leader能力模型提升-小滴课堂
  4. app推广假量怎么识别?
  5. mysql中导入csv文件_怎么把csv文件导入mysql?
  6. 深度学习项目:男女性别识别【附完整源码】
  7. 2018年度获取工作日节假日API
  8. 制作一个简单的倒计时动画
  9. 手把手教您用虹科MatrikonOPC UA数据平台掌握您所有的UA服务器
  10. 多线程下载视频,并运用Fmmpeg合成