Embedding在推荐系统中的应用

文章目录

  • Embedding在推荐系统中的应用
    • Word2vec (2013, Google)
    • Item2vec (2006, 微软)
    • DeepWalk (2014)
    • Node2vec (2016, 斯坦福大学)
    • EGES (2018, 阿里巴巴)
    • 局部敏感哈希 (2008)
    • 其他参考文献

Word2vec (2013, Google)

  • 原理:利用句子中词的相关性建模,利用单隐层神经网络获得词的Embedding 向量
  • 特点:经典 Embedding方法
  • 局限:仅能针对 词序列 样本进行训练

[4-1] MIKOLOV TOMAS,et al. Distributed representations of words and phrases and their compositionality[C].Advances in neural information processing systems.2013.
https://arxiv.org/pdf/1310.4546.pdf

[4-2] MIKOLOV TOMAS, et al. Efficient estimation of word representations in vector space[A/OL]: arXiv preprint arXiv:1301.3781 (2013).
https://arxiv.org/pdf/1301.3781.pdf

[4-3] RONG XIN,Word2vec parameter leaming explained[A/OL]: arXiv preprint arXiv:1411.2738(2014).
https://arxiv.org/pdf/1411.2738.pdf

[4-4] GOLDBERG YOAV,OMER LEVY.Word2vec Explained: deriving Mikolov et al’s negative-sampling word-embedding method[A/OL]: arXiv preprint arXiv:1402.3722(2014).
https://arxiv.org/pdf/1402.3722.pdf


Item2vec (2006, 微软)

  • 原理:把 Word2vec 的思想 扩展 到任何序列数据上
  • 特点:将Word2vec应用于推荐领域
  • 局限:仅能针对 序列 样本进行训练

[4-6] [Item2vec] BARKAN OREN,NOAM KOENIGSTEIN. Item2vec: neural item embedding for collaborative filtering[C]. 2016 IEEE 26th International Workshop on Machine Learning for Signal Processing (MLSP),2016.
https://arxiv.org/vc/arxiv/papers/1603/1603.04259v1.pdf

DeepWalk (2014)

  • 原理:在图结构上进行随机游走,生成序列样本后,利用Word2vec的思想建模
  • 特点:易用的 Graph Embedding方法(图 ->序列,折中
  • 局限:随机游走进行抽样的针对性不强

[4-7] [Deepwalk] PEROZZI BRYAN,RAMI Al-RFOU,STEVEN SKIENA. Deepwalk: Online learning of social representations[C]. Proceedings of the 20th ACM SIGKDD international conference on Knowledge discovery and data mining, 2014.
https://arxiv.org/pdf/1403.6652.pdf

Node2vec (2016, 斯坦福大学)

  • 原理:在DeepWalk的基础上,通过调整随机游走权重的方法使 Graph Embedding的结果在网络的 同质性结构性 之间进行权衡
  • 特点:可以有针对性地挖掘不同的网络特征
  • 局限:需要较多的 人工调参 工作

[4-8] [Node2vec] GROVER,ADITYA,JURE LESKOVEC. node2vec: Scalable feature learning for networks[C]. Proceedings of the 22nd ACM SIGKDD international conference on Knowledge discovery and data mining, 2016.
https://arxiv.org/pdf/1607.00653.pdf

EGES (2018, 阿里巴巴)

  • 原理:将不同信息对应的 Embedding 加权融合 后生成最终的 Embedding向量
  • 特点:融合多种补充信息,解决Embedding的 冷启动 问题
  • 局限:没有较大的学术创新,更多是 从工程角度解决多Embedding融合问题

[4-9] [EGES] WANG JIZHE, et al. Billion-scale commodity embedding for e-commerce Recommender in alibaba[C]. Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining, 2018.
https://arxiv.org/pdf/1803.02349.pdf



局部敏感哈希 (2008)

  • 原理:利用局部敏感哈希的原理进行 快速的Embedding向量最近邻搜索
  • 特点:解决利用 Embedding 作为推荐系统召回层的快速计算问题
  • 局限:存在小概率的最近邻遗漏的可能,需要进行较多的 人工调参。(准确率vs召回率)

[4-12] SLANEY MALCOLM,MICHAEL CASEY.Locality-sensitive hashing for finding nearest neighbors [lecture notes].IEEE Signal processing magazine 25.2, 2008: 128-131.
http://citeseerx.ist.psu.edu/viewdoc/download;jsessionid=807931B596DE2E484EA2DA3C654579D5?doi=10.1.1.160.174&rep=rep1&type=pdf

其他参考文献

[4-5] BENGIO YOSHUA, et al. A neural probabilistic language model[J].Journal of machine learning research 3, 2003: 1137-1155.
http://citeseerx.ist.psu.edu/viewdoc/download;jsessionid=01E90F09439CF6868487792E9F7C054E?doi=10.1.1.62.1441&rep=rep1&type=pdf

[4-10] [LINE] TANG JIAN, et al. Line: Large-scale information network embedding[C]. Proceedings of the 24th international conference on world wide web. International World Wide Web Conferences Steering Committee, 2015.
https://arxiv.org/pdf/1503.03578.pdf

[4-11] [SDNE] WANG DAIXIN,CUI PENG,ZHU WENWU. Structural deep network embedding[C]. Proceedings of the 22nd ACM SIGKDD international conference on Knowledge discovery and data mining, 2016.
https://www.kdd.org/kdd2016/papers/files/rfp0191-wangAemb.pdf

《深度学习推荐系统》学习笔记(5)——Embedding(论文)相关推荐

  1. 读书笔记-深度学习推荐系统4-推荐与embedding

    本篇结合了书籍 <深度学习推荐系统>和吴恩达老师的视频课程 <Natural Language Processing and Word Embeddings>. embeddi ...

  2. 深度学习推荐系统实战笔记

    小广告 (欢迎大家关注我的公众号"机器学习面试基地",之后将在公众号上持续记录本人从非科班转到算法路上的学习心得.笔经面经.心得体会.未来的重点也会主要放在机器学习面试上!) 序 ...

  3. 1. 大数据 机器学习 深度学习 推荐系统 学习路线

    文章目录 思维导图下载 大数据基础 linux NGINX负载均衡 Zookeeper hadoop生态 hadoop hive hbase 大数据数据仓库 数据仓库基础 日志收集系统(Flume) ...

  4. 推荐系统炼丹笔记:Embedding在内存问题上的一种解法

    作 者:一元 公众号:炼丹笔记 很多朋友都会发现,修改embedding的大小能对深度模型带来非常大的影响,往往越大的embedding能带来更佳的效果,但是却因为Embedding内存的问题,没法直 ...

  5. 从未看过如此详细的深度学习推荐系统应用详解,读它!

    作者丨gongyouliu 编辑丨zandy 来源 | 大数据与人工智能(ID:ai-big-data) [导读]2016年DeepMind开发的AlphaGo在围棋对决中战胜了韩国九段选手李世石,一 ...

  6. 重读Youtube深度学习推荐系统论文,字字珠玑,惊为神文

    作者简介,王喆,硅谷高级机器学习工程师. 本文转载自知乎专栏 https://zhuanlan.zhihu.com/p/52169807 这里是王喆的机器学习笔记,每隔一到两周我会站在算法工程师的角度 ...

  7. 带你重读Youtube深度学习推荐系统论文,惊为神文

    来源:知乎专栏 作者:王喆 本文约5400字,建议阅读10+分钟. 本以为毫不起眼的地方,也藏着Youtube工程师宝贵的工程经验. 这里是王喆的机器学习笔记,每隔一到两周我会站在算法工程师的角度讲解 ...

  8. 深度学习推荐系统中各类流行的Embedding方法

    Embedding技术概览: 对其它Embedding技术不熟悉,可以看我的上一篇文章:深度学习推荐系统中各类流行的Embedding方法(上) Graph Embedding简介 Word2Vec和 ...

  9. 深度学习推荐系统中各类流行的Embedding方法(下)

    我的个人微信公众号: Microstrong 微信公众号ID: MicrostrongAI 微信公众号介绍: Microstrong(小强)同学主要研究机器学习.深度学习.推荐系统.自然语言处理.计算 ...

  10. 重读 Youtube 深度学习推荐系统论文,字字珠玑,惊为神文

    雷锋网 AI 科技评论按,本文作者王喆,本文首发于知乎专栏王喆的机器学习笔记,雷锋网 AI 科技评论获得作者授权转载. 这里是王喆的机器学习笔记,每隔一到两周我会站在算法工程师的角度讲解一些计算广告. ...

最新文章

  1. ​我国科学家成功研制全球神经元规模最大的类脑计算机
  2. java static null,我们可以在Java中使用null对象调用静态方法吗?如果是这样,怎么样?...
  3. qfiledialog的取消_QT对话框去掉帮助和关闭按钮
  4. mysql c 多线程封装_mysqlConnectorC/C++多线程封装_MySQL
  5. kafka依赖_kafka的简单学习
  6. (键盘)代码 19:由于其配置信息(注册表中的)不完整或已损坏,Windows 无法启动这个硬件设备 解决方法...
  7. 特斯拉奔驰宝马沃尔沃团灭!安全的半自动驾驶?不存在的
  8. 小程序开发之图片转Base64(C#、.Net)
  9. (转)区块链创造了ICO,但是无法守护ICO
  10. 无监督模型 训练过程_监督使用训练模型
  11. com app.html,downloadApp.html
  12. 李佳琦薇娅直播预告等微博文章采集转链
  13. C标准库stdio源码分析
  14. java openoffic linux_CentOS 下安装 OpenOffice4.0
  15. python爬取微博设备显示怎么更改_Python定向爬虫模拟新浪微博登录
  16. 蓝桥杯 印章Java
  17. tomcat-命令窗口乱码
  18. 解决谷歌翻译不能使用的问题(2023.01.14)
  19. 电大计算机阅读英语作文,关于电大生活的英语作文
  20. Android开发——集成友盟社会化分享遇到的坑(一)

热门文章

  1. 隐藏(删除) Preference 小结
  2. 注意!!微信公众号、小程序、视频号涉及这些行为 将永久封号
  3. html5怎么把图片做成按钮,炫酷实用的jQuery插件 涵盖菜单、按钮、图片 | HTML5资源教程...
  4. 51nod Muddy Fields 2856
  5. 转载:Xilinx DDR3 IP详解与时序分析
  6. C#中读取Excel表格数据实例
  7. AMD FSR技术在UE4移动端可用的研究(二)——4.27的适配
  8. 优思学院|從《狂飙》高启强爱看的《孙子兵法》到六西格玛项目管理
  9. JavaScript中matches和match方法
  10. PHP strtotime 获取自然月误差问题解决方案