Deep_Rank,经典ctr系列预估模型复现框架
向AI转型的程序员都关注了这个号????????????
机器学习AI算法工程 公众号:datayx
Deep_Rank是一套从数据生成到模型生成的完整框架。对输入特征,特征工程,核心模型,模型输出分别进行了封装。模型更新迭代的时候可以针对性的修改指定模块,也方便后续模型的切换,特征的迭代,以及输入数据在输入,特征工程,保存模型,线上服务各个模块的统一配置。本库对一些经典的ctr预估模型进行了复现,如DIN,ESMM,DIEN等。其中也复现了xDeepFM
方便自己在工作中迭代优化模型。
本文相关代码 项目获取方式:
关注微信公众号 datayx 然后回复 CTR 即可获取。
AI项目体验地址 https://loveai.tech
已经实现好的模型有以下几个:
DNN
实现的是一个简单的embedding+MLP,方便调试整体代码,在model_feature.json
中配置wide_or_deep
参数值 "deep"
;
Deep Cross Network(DCN)
在model_feature.json
中只需配置deep特征
,croos层和deep层同用统一的embeddig层。
对应算法论文[click here]
Wide and Deep Network(WD)
需要在model_feature.json
配置wide侧和deep侧对应的特征。
对应算法论文[click here]
Deep Interest Network(DIN)
的上下文特征和基础画像特征需要配置model_feature.json
中,统一使用"deep"
特征,其中需要做attention
的sequence
和sequence对应的目标id
不需要配置在model_feature.json
中,直接配置在模型参数中。
在对应算法论文[click here]
Entire Space Multi-Task Model(ESMM)
也一样,默认只使用"deep"
特征。对应算法论文[click here]
Deep Interest Evolution Network(DIEN)
和DIN一样,序列特征
和序列对应目标id
需要在模型中写。
这里为了实现方便,序列的负采样
部分没有按照原始论文的方式单独使用一份负采样的item数据集,而是直接使用同一个batch
中的其他sequence
作为当前的负采样序列
。
对应算法论文[click here]
DeepFM
的wide侧放线性特征,deep侧放的是统一的MLP和FM的特征
,所有这里必须保证deep特征全部是embedding特征,并且embedding维度全部一致
。这里后续会优化一下,对一些数值特征做优化,方便扩展。
对应算法论文[click here]
xDeepFM
的参数配置和deepFM类似,wide侧放线性特征,deep侧放的是统一的MLP和CIN特征
,所有这里必须保证deep特征全部是embedding特征,并且embedding维度全部一致
。
对应算法论文[click here]
DSSM
需要在wide和deep侧分别放置user info和item info。
对应算法论文[click here]
youtube_net
本文是youtube提出的排序模型 "Recommending What Video to Watch Next: A Multitask Ranking System",不知道叫啥,所以直接叫youtube_net了。
对应算法论文[click here]
后续利用空闲时间和节假日会持续添加新算法
阅读过本文的人还看了以下文章:
【全套视频课】最全的目标检测算法系列讲解,通俗易懂!
《美团机器学习实践》_美团算法团队.pdf
《深度学习入门:基于Python的理论与实现》高清中文PDF+源码
python就业班学习视频,从入门到实战项目
2019最新《PyTorch自然语言处理》英、中文版PDF+源码
《21个项目玩转深度学习:基于TensorFlow的实践详解》完整版PDF+附书代码
《深度学习之pytorch》pdf+附书源码
PyTorch深度学习快速实战入门《pytorch-handbook》
【下载】豆瓣评分8.1,《机器学习实战:基于Scikit-Learn和TensorFlow》
《Python数据分析与挖掘实战》PDF+完整源码
汽车行业完整知识图谱项目实战视频(全23课)
李沐大神开源《动手学深度学习》,加州伯克利深度学习(2019春)教材
笔记、代码清晰易懂!李航《统计学习方法》最新资源全套!
《神经网络与深度学习》最新2018版中英PDF+源码
将机器学习模型部署为REST API
FashionAI服装属性标签图像识别Top1-5方案分享
重要开源!CNN-RNN-CTC 实现手写汉字识别
yolo3 检测出图像中的不规则汉字
同样是机器学习算法工程师,你的面试为什么过不了?
前海征信大数据算法:风险概率预测
【Keras】完整实现‘交通标志’分类、‘票据’分类两个项目,让你掌握深度学习图像分类
VGG16迁移学习,实现医学图像识别分类工程项目
特征工程(一)
特征工程(二) :文本数据的展开、过滤和分块
特征工程(三):特征缩放,从词袋到 TF-IDF
特征工程(四): 类别特征
特征工程(五): PCA 降维
特征工程(六): 非线性特征提取和模型堆叠
特征工程(七):图像特征提取和深度学习
如何利用全新的决策树集成级联结构gcForest做特征工程并打分?
Machine Learning Yearning 中文翻译稿
蚂蚁金服2018秋招-算法工程师(共四面)通过
全球AI挑战-场景分类的比赛源码(多模型融合)
斯坦福CS230官方指南:CNN、RNN及使用技巧速查(打印收藏)
python+flask搭建CNN在线识别手写中文网站
中科院Kaggle全球文本匹配竞赛华人第1名团队-深度学习与特征工程
不断更新资源
深度学习、机器学习、数据分析、python
搜索公众号添加: datayx
长按图片,识别二维码,点关注
Deep_Rank,经典ctr系列预估模型复现框架相关推荐
- 推荐系统CTR(CVR)预估模型(多任务学习)之ESMM
esmm模型是阿里妈妈基础算法团队发表在SIGIR 18上的一篇论文,用来做转化率预估. 整篇论文非常简单,创新点也很通俗易懂,转化率预估目前主要存在两个难点:1.sample selection ...
- 各大厂商CTR广告预估模型的优缺点对比
向AI转型的程序员都关注了这个号
- 深度长文 | 从FM推演各深度CTR预估模型(附开源代码)
作者丨龙心尘 & 寒小阳 研究方向丨机器学习,数据挖掘 题记:多年以后,当资深算法专家们看着无缝对接用户需求的广告收入节节攀升时,他们可能会想起自己之前痛苦推导 FM 与深度学习公式的某个夜晚 ...
- 从FM推演各深度学习CTR预估模型
本文的PDF版本.代码实现和数据可以在我的github取到. 1.引言 点击率(click-through rate, CTR)是互联网公司进行流量分配的核心依据之一.比如互联网广告平台,为了精细化权 ...
- 从FM推演各深度CTR预估模型(附代码)
作者: 龙心尘 && 寒小阳 时间:2018年7月 出处:https://blog.csdn.net/longxinchen_ml/article/details/81031736 h ...
- 1项开源3篇顶会,漫游阿里妈妈外投广告预估模型优化之路
丨目录: · 业务背景 · 技术挑战 · 算法方案 · 未来展望 · 关于我们 1. 业务背景 随着短视频媒体(如抖音.快手等)快速崛起并占据大量用户时长,阿里妈妈的淘系&天猫广告主有着强烈的 ...
- 仅需24小时,带你基于PaddleRec复现经典CTR预估算法
项目背景 偶然看到了[飞桨论文复现挑战赛],抱着 划水 提升自己的态度,报名了一个推荐赛道的赛题.因为本身已经参加工作了,实际空闲时间不是太多,只能晚上下班或者周末和各位参赛大佬卷上一卷,划划水- 工 ...
- Facebook经典CTR预估模型
这里是「王喆的机器学习笔记」的第九篇文章,今天我们重读一篇经典的CTR预估领域的论文,Facebook在2014发表的"Practical Lessons from Predicting C ...
- 深度CTR预估模型的演化之路2019最新进展
作者 | 锅逗逗 来源 | 深度传送门(ID: deep_deliver) 导读:本文主要介绍深度CTR经典预估模型的演化之路以及在2019工业界的最新进展. 介绍 在计算广告和推荐系统中,点击率(C ...
最新文章
- Swift_错误处理
- flink 三种时间机制_Flink的时间与watermarks详解
- 你需要知道的这几种 asp.net core 修改默认端口的方式
- 利用vuex和localStorage实现vue菜单权限管理(笔记)
- paip.提升开发效率--终极方法---组件化及其障碍
- Android源码学习
- 准备好要上传到 Azure 的 Windows VHD 或 VHDX
- MMORPG大型游戏设计与开发(构架)
- 项目:艺龙国内机票实时数据爬虫
- 手把手搭建VuePress文档
- 【渝粤题库】陕西师范大学201931 唐诗研究 作业
- 中考考试的指令广播_2016中招考试广播指导语
- 成功路上并不拥挤 因为坚持的人不多
- Excel使用---excel2016___2维表转1维表(搬,侵删)
- XCTF-攻防世界CTF平台-Reverse逆向类——52、handcrafted-pyc(Python的pyc文件逆向)
- 【限时删除】一个惊艳的神器,可全网爬取各种资源..........
- 多域单点登录SSO系统的实现
- 审查元素html表格后缀,审查元素
- Golang:中“静态”方法
- spring security http.rememberMe()使用和原理解析