https://www.zhihu.com/question/48107602

作者:王凯
链接:https://www.zhihu.com/question/48107602/answer/159801895
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

从id类特征(category类)使用embedding_lookup的角度来讲:

1、onehot编码神经网络处理不来。embedding_lookup虽然是随机化地映射成向量,看起来信息量相同,但其实却更加超平面可分。

2、embedding_lookup不是简单的查表,id对应的向量是可以训练的,训练参数个数应该是 category num*embedding size,也就是说lookup是一种全连接层。详见 brain of mat kelcey

3、word embedding其实是有了一个距离的定义,即出现在同一上下文的词的词向量距离应该小,这样生成向量比较容易理解。autoencode、pca等做一组基变换,也是假设原始特征值越接近越相似。但id值的embedding应该是没有距离可以定义,没有物理意义,只是一种特殊的全连接层。

4、用embedding_lookup做id类特征embedding由google的deep&wide提出,但隐藏了具体实现细节。阿里 第七章 人工智能,7.6 DNN在搜索场景中的应用(作者:仁重) 中提下了面对的困难,主要是参数数量过多(引入紫色编码层)和要使用针对稀疏编码特别优化过的全连接层( Sparse Inner Product Layer )等。

5、在分类模型中用这种id类特征,主要是希望模型把这个商品记住。但id类特征维度太高,同一个商品的数据量也不大,因此也常常用i2i算法产出的item embedding来替代id特征。

一般做自然语言相关的。需要把每个词都映射成向量,这个向量可以是word2vec预训练好的,也可以是在网络里训练的。
在网络里需要先把词的id转换成对应的向量,这个函数就是做这件事的。

转载于:https://www.cnblogs.com/DjangoBlog/p/8001018.html

求通俗讲解下tensorflow的embedding_lookup接口的意思相关推荐

  1. 求通俗解释下bandit老虎机是个什么东西?

      在说bandit之前先考虑一个实际问题:假设你来到一个新的城市,你刚开始选择去哪吃饭可能随机选一选,你大概会知道哪些店比较符合你的口味.当你有了一些基本的判断之后,你是会选择吃原来觉得好吃的店呢? ...

  2. 二维小波变换_小波变换完美通俗讲解系列之 (一)

    声明:该篇文章转自csdn,原始博主已经找不到了,在这里给出转载博主地址,如有侵权,请私信我删除. https://blog.csdn.net/liusandian/article/details/5 ...

  3. Java多数据源最通俗讲解

    Java多数据源最通俗讲解 before after 理论 实操 编码 小总结 before 项目中可能会用到很多的数据源,例如目前这个项目中用到了五个数据源,那么数据源的 配置和数据源的切换就成为了 ...

  4. Tensorflow新版Seq2Seq接口使用

    简介 Tensorflow 1.0.0 版本以后,开发了新的seq2seq接口,弃用了原来的接口. 旧的seq2seq接口也就是tf.contrib.legacy_seq2seq下的那部分,新的接口在 ...

  5. Linux账户标识R=400是什么意思_带你阅读linux内核源码:通俗讲解编译器、交叉编译器和大小端...

    欢迎关注"技术简说",持续分享linux内核和驱动开发干货. 本文内容包括: 编译器和交叉编译器的介绍 交叉编译器的命名规则 如何交叉编译C代码 大端.小端的通俗讲解 如何判断你的 ...

  6. 通俗讲解:PoW共识机制与以太坊的关系、Ghost协议 及 Casper PoS共识机制的变种...

    作者:林冠宏 / 指尖下的幽灵 掘金:juejin.im/user/587f0d- 博客:www.cnblogs.com/linguanh/ GitHub : github.com/af9133374 ...

  7. 通俗讲解:PoW共识机制与以太坊的关系、Ghost协议 及 PoS共识机制的变种---Casper...

    作者:林冠宏 / 指尖下的幽灵 掘金:https://juejin.im/user/587f0dfe128fe100570ce2d8 博客:http://www.cnblogs.com/linguan ...

  8. 人工智能算法通俗讲解系列(二):逻辑回归

    2019独角兽企业重金招聘Python工程师标准>>> 今天,我们介绍的机器学习算法叫逻辑回归.它英语名称是Logistic Regression,简称LR. 跟之前一样,介绍这个算 ...

  9. Hadoop平台K-Means聚类算法分布式实现+MapReduce通俗讲解

        Hadoop平台K-Means聚类算法分布式实现+MapReduce通俗讲解 在Hadoop分布式环境下实现K-Means聚类算法的伪代码如下: 输入:参数0--存储样本数据的文本文件inpu ...

  10. 冲突域、广播域的通俗讲解

    冲突域.广播域的通俗讲解 1.冲突域(物理分段)         连接在同一导线上的所有工作站的集合,或者说是同一物理网段上所有节点的集合或以太网上竞争同一带宽的节点集合.这个域代表了冲突在其中发生并 ...

最新文章

  1. AI科技大本营招实习生了!
  2. 如何利用扬声器构建深度学习网络?
  3. python免费入门手册-python基础入门手册。。。。。。
  4. python3屏幕抓取程序_python之屏幕抓取
  5. c语言中c为字符型便量,c='97'是否正确,C语言判断题Word版
  6. arc 和 非arc兼容
  7. 中国高校计算机考研:计算机数据结构核心考点解析
  8. 微信小程序---家庭记账本开发(三)
  9. 毕设题目:Matlab人脸识别
  10. QT高级编程技巧(二)-- 编写多线程和并发应用
  11. TCA9548A IIC多路扩展模块使用
  12. ATtiny85单片机制作PCB小提琴
  13. adb安装配置及连接手机
  14. 计算机有没有32进制,32进制(32进制转换十进制)
  15. Ubuntu云服务器搭建饥荒联机版服务器教程
  16. Python编程:使用wkhtmltopdf将html网页转成pdf文件
  17. 整理的最新版的K8S安装教程,看完还不会,请你吃瓜
  18. bootstrap模态框保存后清除模态框数据的方法
  19. Linux warning
  20. ErrorCannot find module XXX 解决方法

热门文章

  1. pop3接收网易163邮件及下载超大附件
  2. 增强 扫描王 源码_制作一个类“全能扫描王”的简易扫描软件(opencv)
  3. 本题要求实现一个判断素数的简单函数、以及利用该函数计算给定区间内素数和的函数。
  4. 厦门高考成绩查询2021,2021厦门市地区高考成绩排名查询,厦门市高考各高中成绩喜报榜单...
  5. 微软半日游,和CSDN同学们走进名企
  6. java爬虫爬取京东_java爬虫练习|爬取京东上的手机商品数据
  7. IDS和IPS是什么,有什么区别?
  8. rust服务器人数查询网站,Rust Web框架列表
  9. Python图片按比例缩放后的宽和高(PIL等比缩放)
  10. python给批量图片添加文字_Python之利用PIL批量给图片添加文字