【NLP】Attention函数手册!
作者:一元,四品炼丹师
前言
目前的诸多机器学习相关的问题,诸如推荐问题中的序列处理,时间序列的预测,文本分类等问题都会涉及到Attention函数的使用,Attention已经成为了这些问题在建模时的最为核心的模块。
而我们在实践的过程中发现,attention计算方式的不同对于不同的问题会有些许影响,有的时候影响还很大,所以在本文我们看看有哪些常用的attention函数。
权重函数
我们用Q,K,V分别表示Query,Key和Value。
我们将权重函数分为两个模块函数以及函数。
1.A(Q,K)计算方式
1.Concat策略
其中,表示连接的意思,该策略简单,在一些博客中说此类策略在大数据问题中效果较好,该计算方式来源于论文《NEURAL MACHINE TRANSLATION BY JOINTLY LEARNING TO ALIGN AND TRANSLATE》
2.Minus
3.Add
4.Dot Product
Dot Product的形式最为简单,很多时候我们也经常会使用该函数作为Baseline,但是它的问题也很明显,虽然降低了模型计算复杂度,但是有时会因为相乘得到过大的值影响模型的效果。
5.Bilinear Dot
Bilinear Dot可以认为是Dot Product的扩展形式,有些情况下,Bilinear Dot的效果和Dot Product稍微好一些。
6.Scaled-dot Product
其中是特征的维度。
7.Content-Based
使用cosine距离替代了直接相乘,该计算方式来源于论文《Neural Turing Machines》。
8.扩展
从上面的诸多计算中,我们发现就像是在计算之间的距离,所以很多基于距离的函数都是可以套过来尝试一下的,下面是一些距离的列表,有兴趣的朋友可以比较一下。
2.f()计算
目前最常使用的计算方式主要有下面两种。
1.softmax函数
softmax函数是使用最多的函数也是最为常见的函数,在实践中往往也可以取得不错的效果。
2.TopN softmax
同样地,也是先使用softmax函数进行计算,然后取softmax最大的N个值进行保留,将其它的值全部设置为0,该方法曾经出现在一些推荐相关的问题建模中,可以取得非常不错的效果。
参考文献
Attention基本公式及其变种
Attention? Attention!
[机器学习]常用距离定义与计算
往期精彩回顾适合初学者入门人工智能的路线及资料下载机器学习及深度学习笔记等资料打印机器学习在线手册深度学习笔记专辑《统计学习方法》的代码复现专辑
AI基础下载机器学习的数学基础专辑温州大学《机器学习课程》视频
本站qq群851320808,加入微信群请扫码:
【NLP】Attention函数手册!相关推荐
- Attention函数手册
Attention基本公式及其变种 一元@炼丹笔记 目前的诸多机器学习相关的问题,诸如推荐问题中的序列处理,时间序列的预测,文本分类等问题都会涉及到Attention函数的使用,Attention已经 ...
- 全新开源,《Pytorch常用函数函数手册》开放下载!内含200余个函数!
近期有很多小伙伴在后台咨询有没有关于Pytorch函数使用的学习资料.Pytorch是目前常用的深度学习框架之一,深受学生党的喜爱,小白本人也是使用的Pytorch框架.为了帮助更多小伙伴,小白学视觉 ...
- C语言函数手册:c语言库函数大全|C语言标准函数库|c语言常用函数查询
http://see.xidian.edu.cn/cpp/u/hanshu/ 本函数手册涵盖了常用的C语言函数,从函数功能.参数和返回值三方面做了详细的说明,并且给出了大量实例,加深读者的理解. 为了 ...
- 又一Attention函数诞生啦,带给你意想不到的巨大提升!
Non-invasive Self-attention for Side Information Fusion in Sequential Recommendation(AAAI2021) 一本有仙气 ...
- 最强的Attention函数诞生啦,带给你意想不到的巨大提升!
Non-invasive Self-attention for Side Information Fusion in Sequential Recommendation(AAAI2021) 一本有仙气 ...
- Linux c之函数手册
Linux c函数手册查阅地址 http://man.chinaunix.net/develop/c&c++/linux_c/default.htm
- linux 函数手册 在线,Linux系统API函数手册
Linux系统API函数手册 (34页) 本资源提供全文预览,点击全文预览即可全文预览,如果喜欢文档就下载吧,查找使用更方便哦! 11.90 积分 (一)文件操作篇 1.creat(建立文件)头文件1 ...
- 哈工大博士历时半年整理的《Pytorch常用函数函数手册》开放下载!内含200余个函数!...
近期有很多小伙伴在公众号后台咨询有没有关于Pytorch函数使用的学习资料.Pytorch是目前常用的深度学习框架之一,深受学生党的喜爱,小白本人也是使用的Pytorch框架.为了帮助更多小伙伴,小白 ...
- php函数 chm,php函数手册chm最新
c 语言常用函数手册 chm 格式 /... PHP GD函数库_计算机软件及应用_IT/计算机_专业资料.GD 函数库 一. 安装 GD 库 1. 编辑 PHP 配置文件-php.ini 2. 启用 ...
最新文章
- 打开数“智”化之门,一字之差带来的思考
- freeRtos学习笔(3)临界区管理
- mysql 将查询所得结果集的某一字段拼接成字符串
- android学习笔记46——File存储
- jzoj4050-寻宝游戏【二分,树状数组,LCA】
- libevent源码深度剖析五
- EDC(Enterprise Data Center 企业数据中心)
- coreldraw x5 选择工具快捷键_CorelDRAW设置和优化提高工作效率
- BroadcastReceiver广播
- vue可缓存的单页面多标签页
- mysqli得到记录数量
- MySQL 添加列 修改列 删除列
- 使用HighCharts实现实时数据展示
- Flex中Image加载图片出错显示默认图片
- 十大淘宝搜索作弊行为
- warning: cast to pointer from integer of different size [-Wint-to-pointer-cast]
- H3C无线网络延时大、数据丢包,不能上网,原来是有BUG
- 计算机后台打印机程序,打印机不能正常工作,提示'操作无法完成,后台打印程序服务没有运行'的解决方法...
- Windows_XP SP3 Profession 正版密钥
- 企微群机器人定时提醒