陋室快报 | BERT主流衍生语言模型-20211106
陋室快报
陋室快报是对陋室推荐栏目更新优化后的版本,更快更准的给大家推荐优质信息,频率预计是一周一次。敬请关注。栏目介绍:陋室快报栏目介绍。
近期,我再次总结了我的历史文章,累积起来有50w字,百余篇文章了,有兴趣可以拿来看看,获取方式:七夕清流,百余篇累计50w字文章合集发布。
往期回顾:
陋室快报 | 程序员节快乐!栏目介绍-20211024
陋室快报 | BERT学习指导-20211026
上一期给大家汇总了BERT基础相关的内容,这一期给大家讲一下BERT语言模型比较热门的衍生,以及一些讲的比较好的文章,供大家深入学习和参考。
热门模型串讲
想知道一个大概或者各个论文的核心要点,其实看看串讲就OK了,这里推荐这几个:
从BERT, XLNet, RoBERTa到ALBERT:https://zhuanlan.zhihu.com/p/84559048
常用预训练语言模型(PTMs)总结:https://zhuanlan.zhihu.com/p/406512290
专题论文解读
要想知道细节,肯定就要精读了,论文肯定是首要的,而想在论文基础上找些辅助或者是提炼,那可以看看这些文章的。当然,我没有全部列举,只是列了一下工业界或者是大家比较常听见的集中。
ALBERT
预训练模型-ALBERT:https://zhuanlan.zhihu.com/p/104733717
RoBERTa
RoBERTa 详解:https://zhuanlan.zhihu.com/p/103205929
XLNet
Google XLNet原理解读:https://zhuanlan.zhihu.com/p/70218096
T5
T5 模型:NLP Text-to-Text 预训练模型超大规模探索:https://zhuanlan.zhihu.com/p/88438851
MacBERT
NLP系列之预训练模型(三):最强中文预训练模型MacBERT:https://zhuanlan.zhihu.com/p/356867198
NEZHA
NEZHA(哪吒)论文阅读笔记:https://zhuanlan.zhihu.com/p/100044919
蒸馏
自己之前有研究过BERT的蒸馏,所以积累了一些,之类只提两个比较有代表意义的吧:
DistillBert: Bert太贵?我便宜又好用:https://zhuanlan.zhihu.com/p/165516661
比 Bert 体积更小速度更快的 TinyBERT:https://zhuanlan.zhihu.com/p/94359189
陋室快报 | BERT主流衍生语言模型-20211106相关推荐
- 陋室快报 | BERT学习指导-20211026
[陋室推荐] 陋室快报是对陋室推荐栏目更新优化后的版本,更快更准的给大家推荐优质信息,频率预计是一周一次.敬请关注. 近期,我再次总结了我的历史文章,累积起来有50w字,百余篇文章了,有兴趣可以拿来看 ...
- 陋室快报-对比学习热文-20211115
陋室快报 陋室快报是对陋室推荐栏目更新优化后的版本,更快更准的给大家推荐优质信息,频率预计是一周一次.敬请关注.栏目介绍:陋室快报栏目介绍. 近期,我再次总结了我的历史文章,累积起来有50w字,百余篇 ...
- 陋室快报 | 近期好文分享-20211127
陋室快报 陋室快报是对陋室推荐栏目更新优化后的版本,更快更准的给大家推荐优质信息,频率预计是一周一次.敬请关注.栏目介绍:陋室快报栏目介绍. 近期,我再次总结了我的历史文章,累积起来有50w字,百余篇 ...
- 陋室快报 | 算法工程师的常用数据工具-20211127
陋室快报 陋室快报是对陋室推荐栏目更新优化后的版本,更快更准的给大家推荐优质信息,频率预计是一周一次.敬请关注.栏目介绍:陋室快报栏目介绍. 近期,我再次总结了我的历史文章,累积起来有50w字,百余篇 ...
- 陋室快报-语义表征的突破口——人脸识别-20211121
陋室快报 陋室快报是对陋室推荐栏目更新优化后的版本,更快更准的给大家推荐优质信息,频率预计是一周一次.敬请关注.栏目介绍:陋室快报栏目介绍. 近期,我再次总结了我的历史文章,累积起来有50w字,百余篇 ...
- 陋室快报 | 近期好文分享:CLUE最新发布KgCLUE,开放域对话,Prompt-29211212
陋室快报 陋室快报是对陋室推荐栏目更新优化后的版本,更快更准的给大家推荐优质信息,频率预计是一周一次.敬请关注.栏目介绍:陋室快报栏目介绍. 近期,我再次总结了我的历史文章,累积起来有50w字,百余篇 ...
- 陋室快报 | 程序员节快乐!栏目介绍-20211024
陋室快报 陋室快报是对陋室推荐栏目更新优化后的版本,更快更准的给大家推荐优质信息,频率预计是一周一次.敬请关注. 近期,我再次总结了我的历史文章,累积起来有50w字,百余篇文章了,有兴趣可以拿来看看, ...
- Bert算法:语言模型-BERT详细介绍
本文的目的是向NLP爱好者们详细解析一个著名的语言模型-BERT. 全文将分4个部分由浅入深的依次讲解. 1.Bert简介 BERT是2018年10月由Google AI研究院提出的一种预训练模型. ...
- 从NNLM到Bert,NLP语言模型发展概述
NNLM 主要内容:利用前n-1个词汇,预测第n个词汇 提出了基于连续空间编码 + 神经网络的NNLM模型 对于一个单词普遍采用的是one-hot编码方式,如果语料库的单词数目特别多,就会导致一个单词 ...
最新文章
- 疯狂打地鼠游戏核心代码(鼠标变锤子)
- 关于Xcode6编译变更 “Implicit declaration of function 'sysctl' is invalid in C99” 报错问题
- web.config中配置字符串中特殊字符的处理
- jQuery框架总体分析
- JQuery入门 初级插件02
- Linex系统 配置php服务器
- myeclipse6.5安装jrable
- 《财富》2022全球500强榜单,沃尔玛九连冠,沙特阿美最赚钱,中国公司上榜最多 | 美通社头条...
- 学习笔记1——制作数据集
- (JAVA)基于Socket的TCP和UDP编程(第一章)
- Java8 根据身份证号获取年龄
- 机器学习实验——分类学习算法
- android手机设置固定dns,手机dns怎么设置 简单几步就搞定
- ARMv7 汇编在线调试工具
- c语言表示时间的程序,C语言显示“当前时间”小程序
- 语音识别入门 --各个模型的整理
- 污水处理程序 工厂污水处理控制系统。 西门子PLC200smart和上位机wincc(版本号V7.4)污水处理控制系统
- DispcalGUI 蓝蜘蛛 Spyder Pro 4 校色
- android 修改rom大小,安卓手机修改G1 ROM
- SpringBoot的Undertow和Tomcat对比
热门文章
- ios阵营和android阵营,Android VS iOS永恒的辩题!不吵架,聊聊两个阵营吧!
- 浏览器 User-Agent解析
- 3步搞定销售分析报表
- 安华金和技术副总裁杨海峰:金融行业数据实时共享场景下的动态脱敏技术
- 【Transformer】浅谈 Transformer-based 模型中的位置表示
- 第五人格8月8日服务器维护几小时,第五人格6月8日无法登陆是怎么回事
- 7天物联网智能家居实战-DAY7
- c语言递进循环程序,基于“阶梯递进”模式《C语言程序设计》主讲教材的设计.pdf...
- 计算机二级通过率最高的科目 哪科最简单
- plusmytag_js.php,dedecms之webshell后门分析