Query,Key,Value的概念取自于信息检索系统,举个简单的搜索的例子来说。当你在某电商平台搜索某件商品(年轻女士冬季穿的红色薄款羽绒服)时,你在搜索引擎上输入的内容便是Query,然后搜索引擎根据Query为你匹配Key(例如商品的种类,颜色,描述等),然后根据Query和Key的相似度得到匹配的内容(Value)。
来源:https://zhuanlan.zhihu.com/p/48508221

可以参考下图,每一个单词都有QKV这三个向量,这里运用了注意力机制,也有是会去求其他单词和该单词的匹配度,那Q表示的就是与我这个单词相匹配的单词的属性,K就表示我这个单词的本身的属性,V表示的是我这个单词的包含的信息本身。

这三个向量都是对embedding线性运算得到的,其实就是一个矩阵乘法。参考第二张图。

参考:
https://zhuanlan.zhihu.com/p/48508221
http://jalammar.github.io/illustrated-transformer/

Transformer中Q,K,V的理解相关推荐

  1. 《Attention Is All You Need》注意力机制公式中Q,K,V的理解

    一.概述 <Attention Is All You Need>是一篇关于注意力机制里程碑的文章,从2017年发表至今2020年7月已经获得了上万的引用.该文的两大亮点一是提出了一个几乎仅 ...

  2. 深度学习attention机制中的Q,K,V分别是从哪来的?

    提问:找了各种资料,也读了论文原文,都是详细介绍了怎么把Q,K,V通过什么样的运算得到输出结果,始终没有一个地方有解释Q,K,V是从哪来的?一个layer的输入不就是一个tensor吗,为什么会有Q, ...

  3. 神经网络 注意力机制 Q K V 理解

    注意力机制 公式 为了简单假定       Q矩阵 K矩阵一样 Q                                                   K转置              ...

  4. transformer注意力机制的理解(Q,K,V,dk)

    Attention公式: 上面这个注意力公式可以理解为是算 V 的加权后的表示 权重就是V前面的所有部分, 其中 softmax 可以使得权重概率分布和为1. 其中  算的就是注意力的原始分数(其实也 ...

  5. 在js中使用HashMap数据结构,在js中使用K,V数据结构

    首先是定义一个HashMap方法,做基类(复制在js中即可,然后引用) //简单的哈希表,begin function HashMap() {/** Map 大小 * */var size = 0;/ ...

  6. 深度学习的相似度计算 向量之间的相似程度计算 Q K V的注意力权重

    https://blog.csdn.net/qq_32797059/article/details/106502737

  7. self attentin Q K V心得

    https://blog.csdn.net/weixin_43821843/article/details/103208033?utm_medium=distribute.pc_relevant.no ...

  8. 注意力机制Q K V

    https://zhuanlan.zhihu.com/p/67115572 要点: 在模型训练好后,根据attention矩阵,我们就可以得到源语言和目标语言的对齐矩阵了 通过设计一个函数将目标模块m ...

  9. transformer中QKV的通俗理解(渣男与备胎的故事)

    transformer中QKV的通俗理解(渣男与备胎的故事) 用vit的时候读了一下transformer的思想,前几天面试结束之后发现对QKV又有点忘记了, 写一篇文章来记录一下 参考链接: 哔哩哔 ...

最新文章

  1. mysql密码错误 mac_MAC下MYSQL5.7.17连接不上提示密码错解决步骤
  2. comsol matlab 循环,comsol保存为m文件,怎样在m文件里面加入for循环 - 仿真模拟 - 小木虫 - 学术 科研 互动社区...
  3. 启动celery后执行任务报错:django.core.exceptions.ImproperlyConfigured
  4. C/C++基本数据类型所占字节数
  5. undefined reference to `jpeg_std_error(jpeg_error_mgr*)
  6. html5多颜色灯笼旋转,HTML5 Canvas 漂亮的斑马条纹灯笼
  7. cisco 基础配置命令中文解析 1
  8. [转载] JavaScrip ajaxt和python flask通过json传递数据的方法
  9. 简单的redis使用watch完成秒杀抢购功能
  10. 【Android Developers Training】 7. 添加Action Buttons
  11. Dev-C++/Cpp使用入门详解
  12. 配置管理口管理曙光服务器
  13. 一步一步从原理跟我学邮件收取及发送 7.读取一行命令的实现
  14. php 豆瓣api_豆瓣申请API Key教程
  15. 用matlab求方程组解的三种方法
  16. k8s 存活检查与就绪检查
  17. 任志远先生,庄振宏先生就任新加坡区块链技术基金会理事
  18. Kotlin学习(二十): Kotlin实现流的读取的方案
  19. 华为P20 Pro对比iPhone X:谁更能拍出人像高级美?
  20. Android之WiFi连接检测

热门文章

  1. 基于framebuffer(fb)的驱动分析
  2. java抽象语法树(ast),AST 抽象语法树
  3. Shell 获取指定日期 N 天/月/年前(后)的日期
  4. c语言b6=1什么意思,维生素c加维生素b6功效
  5. 找不到所选字体 “Cascadia Mono“。 改为选择 “Consolas“。教程
  6. linux riot密码,在Linux系统上安装Riot的方法
  7. 软件开发人员怎么升职加薪?技术高管建议你这么做
  8. 关于 Chrome 谷歌浏览器 安装未封装插件的问题
  9. 帮你抢小游戏流量红利——华为小游戏接入指南
  10. 来听听资深设计师的想法(上)