文章参考: Modeling Localness for Self-Attention Networks

分散注意力机制的思路是先验的让一些特征仅仅依赖于邻近的信息. 本文的思路是考虑全局信息的同时也添加局部信息.
具体地,
A^eG\hat{A} e^{G} A^eG
A^\hat{A}A^ 是权重矩阵, 即 softmax(QKT/d)\text{softmax}(QK^T/\sqrt{d})softmax(QKT/d​). Gn×nG_{n \times n}Gn×n​, n 是文字长度(含词汇的数目), 称作 Gauss 偏向.
Gi,j=−(j−Pi)22σi2.G_{i,j}=-\frac{(j-P_i)^2}{2\sigma_i^2}.Gi,j​=−2σi2​(j−Pi​)2​.
含义是 衡量中心词汇 和 距离为 j 的词汇 的关联程度. 可以看出距离越远, 关联越低.

这里需要确定的是 PiP_iPi​ 和 σi\sigma_iσi​. 由经验σi:=Di2\sigma_i:=\frac{D_i}{2}σi​:=2Di​​. DiD_iDi​ 是局部视野, 或者说窗口. 如果看图像, f(j):=eGi,jf(j):=e^{G_{i,j}}f(j):=eGi,j​ 会发现, jjj 增大到一定程度, f(j)f(j)f(j) 的梯度几乎为0.

如是问题变为确定 中心 PiP_iPi​ 和 视野 DiD_iDi​.

(PiDi)=I⋅sigmoid((pizi)).\left( \begin{array}{c} P_{i} \\ D_{i} \end{array} \right) =\text{I} \cdot \text{sigmoid}( \left( \begin{array}{c} p_{i} \\ z_{i} \end{array} \right)).(Pi​Di​​)=I⋅sigmoid((pi​zi​​)).
中心 pip_ipi​ 仅仅和 相应的 query 向量有关. 设为
pi:=UpTtanh(WpQi).p_i:=U_p^T\text{tanh}(W_pQ_i). pi​:=UpT​tanh(Wp​Qi​).
Up∈RdU_p \in \R^dUp​∈Rd, WpW_pWp​ 为 d×dd \times dd×d 矩阵, 都是待定参量.

对于 ziz_izi​, 思路比较多. 有取固定值的.

依赖于 key 的均值.
z:=UdTtanh(WdKˉ).z:=U_d^T\text{tanh}(W_d\bar{K}). z:=UdT​tanh(Wd​Kˉ).

依赖于 query.
z:=UdTtanh(WpQi).z:=U_d^T\text{tanh}(W_pQ_i). z:=UdT​tanh(Wp​Qi​).

容易将之推广到多头注意力.

自注意机制中添加局部信息相关推荐

  1. R语言ggplot2可视化在图像中添加脚注信息(footnote)实战:自定义脚注信息的位置、对齐形式、图的脚注、整个网格的脚注

    R语言ggplot2可视化在图像中添加脚注信息(footnote caption)实战:自定义脚注信息的位置.对齐形式.图的脚注.整个网格的脚注 目录

  2. Android开发过程中在sh,py,mk文件中添加log信息的方法

    Android开发过程中在sh,py,mk文件中添加log信息的方法 在sh文件中: echo "this is a log info" + $info 在py文件中: print ...

  3. ArcIMS 投影问题 如何向地图配置文件中添加投影信息(转载)

    ArcIMS 投影问题 如何向地图配置文件中添加投影信息 编号: 000181 相关产品及版本: ArcIMS  3.1, 4.0,9.0 平台: N/A 提交时间: 2004-12-15   修改时 ...

  4. 在web.config中添加配置信息

    1 在web.config中添加配置信息<configuration><connectionStrings><add name="conStr" co ...

  5. mysql 字段增加备注_怎么在mysql数据库中添加备注信息

    怎么在mysql数据库中添加备注信息 发布时间:2021-02-20 16:04:19 来源:亿速云 阅读:56 作者:Leah 这期内容当中小编将会给大家带来有关怎么在mysql数据库中添加备注信息 ...

  6. android向apk的META-INF(签名信息)中添加渠道信息

    作者:燕歆波 导读:在没有源码的情况下,为了避免重新签名,直接在签名信息中添加渠道信息; 准备好两个文件:一个空文件"channel_fhxs"没有后缀名,还有一个.prepert ...

  7. Python之向日志输出中添加上下文信息

    除了传递给日志记录函数的参数(如msg)外,有时候我们还想在日志输出中包含一些额外的上下文信息.比如,在一个网络应用中,可能希望在日志中记录客户端的特定信息,如:远程客户端的IP地址和用户名.这里我们 ...

  8. 谷歌浏览器在怎么添加迅雷_如何在Google搜索结果中添加作者信息

    谷歌浏览器在怎么添加迅雷 How to enable the author information in Google search results as shown for many posts? ...

  9. 设计变更时,如何直接在工程图中添加修订信息?

    通常制造型企业在进行产品设计变更时,都是通过手动在工程图中添加修订表变更信息来进行流程跟踪的.而SOLIDWORKS PDM与SOLIDWORKS修订表已经实现了双向集成功能:这也就意味着,利用PDM ...

最新文章

  1. 2013福建高职单招计算机类专业,福建省2013高职单招计算机类试题及答案.doc
  2. ubuntu14.04安装intel openCL
  3. python --函数
  4. 选择排序、冒泡排序、异或运算
  5. Java体系学习书籍推荐,BAT 面试官 如何面试
  6. 推荐系统系列教程之十一:那些在Netflix Prize中大放异彩的推荐算法
  7. sap脚本运行_如何使用Python脚本运行SAP?
  8. bzoj 1042: [HAOI2008]硬币购物(dp+容斥)
  9. MSP432P401R学习:CCS入门实验练习,使用CCS新建、导入、编译、下载工程
  10. word2010分页设置页眉
  11. ZincSearch轻量级全文搜索引擎入门到
  12. catia二次开发:人机交互select,start command
  13. Couldn't figure out the Java version of /root/.jenkins/jdk/bin/java bash: /root/.jenkins/jdk/bin/jav
  14. 自动泊车之AVM环视系统算法框架
  15. 和平精英灵敏度分享码服务器没有响应,不求人灵敏度分享码 和平精英最新吃鸡灵敏度...
  16. BootStrap框架模块:BootStrap4基础
  17. 线性代数笔记(矩阵)
  18. Golang学习笔记汇总
  19. 2023NPDP产品经理认证如何考取?
  20. android应用中为按键添加声音

热门文章

  1. 恍然大悟!顺其自然就是最高的智慧
  2. POJ 3311--佛洛依德枚举
  3. mysql性能优化(摘自微信公众号:caoz的梦呓)
  4. 数据接口异常中的错误
  5. sql count函数
  6. access ole 读取 java_从Access中读取OLE对象的bitmap,参数无效!
  7. Nightingale滴滴夜莺监控系统入门(五)--采集功能
  8. lunix命令向文件添加内容的几种方法
  9. [ES6] 01. Intro to ES6 and traceur compiler
  10. 在conda环境中更新pycocotools出现的required to install pyproject. toml-based projects报错解决方案!