注意力机制的两种形式:
一、additive attention(tensorflow里面称为Bahdanau attention)
       这种机制的定义引用了论文https://arxiv.org/pdf/1409.0473.pdf

该注意力机制最显著的特征就是Q与K的对齐函数使用了一层神经网络;

二、第二种机制dot-product attention(multiplicative/Luong    attention)

这种机制引用 attention is all your need论文中解释:

这种机制最显著的特征就是Q与K的对齐函数直接点乘;

从其他地方有一个统计,如下所示:

注意力机制理解好文:Attention Mechanism

注意力机制的两种形式相关推荐

  1. NGINX轮询机制的几种形式

    前言:总以为轮询就简单的next而已,实际还有几种不同的实现机制.某个客户的源站有几个不同的IP,回源的时候自然是采用的轮询的机制.客户业务上线前,检查源站的联通性发现一个漏网之鱼竟然差点滥竽充数.然 ...

  2. c语言中的普通字符包括什么,【判断题】C语言中的字符常量通常有两种形式:普通字符和转义字符。...

    [判断题]C语言中的字符常量通常有两种形式:普通字符和转义字符. 更多相关问题 ---Can you speak French?---Yes, but only____.A.a littleB.lit ...

  3. SQL 关于apply的两种形式cross apply 和 outer apply

    SQL 关于apply的两种形式cross apply 和 outer apply 阅读目录 SQL 关于apply的两种形式cross apply 和 outer apply Sql学习第四天--S ...

  4. 【算法笔记】莫比乌斯反演(包含定理,两种形式的证明及入门经典模板)

    整理的算法模板合集: ACM模板 目录 一.莫比乌斯反演 二.几个概念和定理 三.两种形式的莫比乌斯反演证明 四.POJ 3904 Sky Code(入门例题) 一.莫比乌斯反演 学习笔记,我是看这个 ...

  5. java语言的多态性及特点_Java中的方法的多态性有两种形式:( )和( )。_学小易找答案...

    [填空题]已知函数 ,则微分 . [填空题]. [单选题]71.用转动小滑板法车圆锥时产生( )误差的原因是小滑板转动角度计算错误. [单选题] [填空题]Java中的方法的多态性有两种形式:( )和 ...

  6. Go 两种形式的“类型转换”

    Go 的类型转换常常让人有点迷,有两种形式的"类型转换": Type(obj) :这种形式的类型转换要求 obj 对象的类型和 Type 是等价类型,即实现了相同的方法 obj.( ...

  7. include的两种形式、CPP的搜索路径

    文章目录 1 include的两种形式.CPP的搜索路径 1 include的两种形式.CPP的搜索路径 #include "stdio.h" //1.源文件所在路径//2.-I选 ...

  8. Python基础day05【函数(函数传参的两种形式、函数形参)、拆包、引用、可变与不可变类型、引用做函数参数注意点】

    视频.源码.课件.软件.笔记:超全面Python基础入门教程[十天课程]博客笔记汇总表[黑马程序员]    目录 0.复习 1.函数传参的两种形式[掌握] 2.函数形参 2.1.缺省参数(默认参数) ...

  9. MyBatis collection的两种形式——MyBatis学习笔记之九

    与association一样,collection元素也有两种形式,现介绍如下: 一.嵌套的resultMap 实际上以前的示例使用的就是这种方法,今天介绍它的另一种写法.还是以教师映射为例,修改映射 ...

最新文章

  1. 轮播图html_【技术篇前端】用html+css实现小米首页部分内容(含源码,不含轮播图)...
  2. python输入正整数n、求n以内能被17整除的最大正整数_求100之内自然数中最大的能被17整除的数...
  3. python学了有什么用处-Python主要用途是哪些,跟机器学习等有啥关系呢?
  4. WPF快速指导1:资源
  5. Should i Backup all my domain controllers
  6. 基于FTP的Nordic nRF51822 OTA 教程一之修改boot区大小
  7. 【顶尖技术人是怎样炼成的】清华博士的模型信仰——对话阿里云 MVP陈旸
  8. git如何强制用远程分支更新本地
  9. Android平台Chromium net中的代理配置信息获取
  10. Hyper-V 嵌套虚拟化
  11. 【Pytorch神经网络实战案例】16 条件WGAN模型生成可控Fashon-MNST模拟数据
  12. Docker-Compose 基础与实战,看这一篇就够了 | 原力计划
  13. MediaCodec 编码H264 编码一帧后dequeueOutputBuffer为-1的问题
  14. 里氏替换原则_趣谈设计模式之里氏替代原则
  15. JAVA集合框架概述
  16. C# Winform设置焦点
  17. scrapy框架中Spider源码解析
  18. 多智能体强化学习入门(七)——AC for CDec-POMDP 大规模规划学习算法
  19. 原生七彩影视APP源码 支持PC+WAP+APP三端
  20. torch.multinomial使用

热门文章

  1. 5道Python函数练习
  2. Python 各种读取保存tif,tiff,png,jpg,mat等格式图像方法大集合
  3. python logging模块写入中文,文件乱码的解决方法
  4. 【放置奇兵】新版公会战问题
  5. CSDN博客导出备份工具
  6. python 编程笔记
  7. Distance 几何,构造(800)
  8. java 过滤攻击报文_Spring Boot XSS 攻击过滤插件使用
  9. wegame饥荒一直连接中_腾讯WeGame注册用户超3亿 国产游戏销量超500万
  10. html2image api,图像标签_图像识别 Image_API参考_API_华为云