向AI转型的程序员都关注了这个号????????????

机器学习AI算法工程   公众号:datayx

Deep_Rank是一套从数据生成到模型生成的完整框架。对输入特征,特征工程,核心模型,模型输出分别进行了封装。模型更新迭代的时候可以针对性的修改指定模块,也方便后续模型的切换,特征的迭代,以及输入数据在输入,特征工程,保存模型,线上服务各个模块的统一配置。本库对一些经典的ctr预估模型进行了复现,如DIN,ESMM,DIEN等。其中也复现了xDeepFM方便自己在工作中迭代优化模型。

本文相关代码 项目获取方式:

关注微信公众号 datayx  然后回复  CTR  即可获取。

AI项目体验地址 https://loveai.tech

已经实现好的模型有以下几个:

DNN 实现的是一个简单的embedding+MLP,方便调试整体代码,在model_feature.json中配置wide_or_deep参数值 "deep";

Deep Cross Network(DCN)model_feature.json中只需配置deep特征,croos层和deep层同用统一的embeddig层。
对应算法论文[click here]

Wide and Deep Network(WD)需要在model_feature.json配置wide侧和deep侧对应的特征。
对应算法论文[click here]

Deep Interest Network(DIN)的上下文特征和基础画像特征需要配置model_feature.json中,统一使用"deep"特征,其中需要做attentionsequencesequence对应的目标id不需要配置在model_feature.json中,直接配置在模型参数中。
在对应算法论文[click here]

Entire Space Multi-Task Model(ESMM)也一样,默认只使用"deep"特征。对应算法论文[click here]

Deep Interest Evolution Network(DIEN)和DIN一样,序列特征序列对应目标id需要在模型中写。
这里为了实现方便,序列的负采样部分没有按照原始论文的方式单独使用一份负采样的item数据集,而是直接使用同一个batch中的其他sequence作为当前的负采样序列
对应算法论文[click here]

DeepFM的wide侧放线性特征,deep侧放的是统一的MLP和FM的特征,所有这里必须保证deep特征全部是embedding特征,并且embedding维度全部一致。这里后续会优化一下,对一些数值特征做优化,方便扩展。
对应算法论文[click here]

xDeepFM的参数配置和deepFM类似,wide侧放线性特征,deep侧放的是统一的MLP和CIN特征,所有这里必须保证deep特征全部是embedding特征,并且embedding维度全部一致
对应算法论文[click here]

DSSM需要在wide和deep侧分别放置user info和item info。
对应算法论文[click here]

youtube_net本文是youtube提出的排序模型 "Recommending What Video to Watch Next: A Multitask Ranking System",不知道叫啥,所以直接叫youtube_net了。
对应算法论文[click here]

后续利用空闲时间和节假日会持续添加新算法


阅读过本文的人还看了以下文章:

【全套视频课】最全的目标检测算法系列讲解,通俗易懂!

《美团机器学习实践》_美团算法团队.pdf

《深度学习入门:基于Python的理论与实现》高清中文PDF+源码

python就业班学习视频,从入门到实战项目

2019最新《PyTorch自然语言处理》英、中文版PDF+源码

《21个项目玩转深度学习:基于TensorFlow的实践详解》完整版PDF+附书代码

《深度学习之pytorch》pdf+附书源码

PyTorch深度学习快速实战入门《pytorch-handbook》

【下载】豆瓣评分8.1,《机器学习实战:基于Scikit-Learn和TensorFlow》

《Python数据分析与挖掘实战》PDF+完整源码

汽车行业完整知识图谱项目实战视频(全23课)

李沐大神开源《动手学深度学习》,加州伯克利深度学习(2019春)教材

笔记、代码清晰易懂!李航《统计学习方法》最新资源全套!

《神经网络与深度学习》最新2018版中英PDF+源码

将机器学习模型部署为REST API

FashionAI服装属性标签图像识别Top1-5方案分享

重要开源!CNN-RNN-CTC 实现手写汉字识别

yolo3 检测出图像中的不规则汉字

同样是机器学习算法工程师,你的面试为什么过不了?

前海征信大数据算法:风险概率预测

【Keras】完整实现‘交通标志’分类、‘票据’分类两个项目,让你掌握深度学习图像分类

VGG16迁移学习,实现医学图像识别分类工程项目

特征工程(一)

特征工程(二) :文本数据的展开、过滤和分块

特征工程(三):特征缩放,从词袋到 TF-IDF

特征工程(四): 类别特征

特征工程(五): PCA 降维

特征工程(六): 非线性特征提取和模型堆叠

特征工程(七):图像特征提取和深度学习

如何利用全新的决策树集成级联结构gcForest做特征工程并打分?

Machine Learning Yearning 中文翻译稿

蚂蚁金服2018秋招-算法工程师(共四面)通过

全球AI挑战-场景分类的比赛源码(多模型融合)

斯坦福CS230官方指南:CNN、RNN及使用技巧速查(打印收藏)

python+flask搭建CNN在线识别手写中文网站

中科院Kaggle全球文本匹配竞赛华人第1名团队-深度学习与特征工程

不断更新资源

深度学习、机器学习、数据分析、python

 搜索公众号添加: datayx  

长按图片,识别二维码,点关注

Deep_Rank,经典ctr系列预估模型复现框架相关推荐

  1. 推荐系统CTR(CVR)预估模型(多任务学习)之ESMM

     esmm模型是阿里妈妈基础算法团队发表在SIGIR 18上的一篇论文,用来做转化率预估.  整篇论文非常简单,创新点也很通俗易懂,转化率预估目前主要存在两个难点:1.sample selection ...

  2. 各大厂商CTR广告预估模型的优缺点对比

    向AI转型的程序员都关注了这个号

  3. 深度长文 | 从FM推演各深度CTR预估模型(附开源代码)

    作者丨龙心尘 & 寒小阳 研究方向丨机器学习,数据挖掘 题记:多年以后,当资深算法专家们看着无缝对接用户需求的广告收入节节攀升时,他们可能会想起自己之前痛苦推导 FM 与深度学习公式的某个夜晚 ...

  4. 从FM推演各深度学习CTR预估模型

    本文的PDF版本.代码实现和数据可以在我的github取到. 1.引言 点击率(click-through rate, CTR)是互联网公司进行流量分配的核心依据之一.比如互联网广告平台,为了精细化权 ...

  5. 从FM推演各深度CTR预估模型(附代码)

    作者: 龙心尘 && 寒小阳 时间:2018年7月 出处:https://blog.csdn.net/longxinchen_ml/article/details/81031736 h ...

  6. 1项开源3篇顶会,漫游阿里妈妈外投广告预估模型优化之路

    丨目录: · 业务背景 · 技术挑战 · 算法方案 · 未来展望 · 关于我们 1. 业务背景 随着短视频媒体(如抖音.快手等)快速崛起并占据大量用户时长,阿里妈妈的淘系&天猫广告主有着强烈的 ...

  7. 仅需24小时,带你基于PaddleRec复现经典CTR预估算法

    项目背景 偶然看到了[飞桨论文复现挑战赛],抱着 划水 提升自己的态度,报名了一个推荐赛道的赛题.因为本身已经参加工作了,实际空闲时间不是太多,只能晚上下班或者周末和各位参赛大佬卷上一卷,划划水- 工 ...

  8. Facebook经典CTR预估模型

    这里是「王喆的机器学习笔记」的第九篇文章,今天我们重读一篇经典的CTR预估领域的论文,Facebook在2014发表的"Practical Lessons from Predicting C ...

  9. 深度CTR预估模型的演化之路2019最新进展

    作者 | 锅逗逗 来源 | 深度传送门(ID: deep_deliver) 导读:本文主要介绍深度CTR经典预估模型的演化之路以及在2019工业界的最新进展. 介绍 在计算广告和推荐系统中,点击率(C ...

最新文章

  1. Swift_错误处理
  2. flink 三种时间机制_Flink的时间与watermarks详解
  3. 你需要知道的这几种 asp.net core 修改默认端口的方式
  4. 利用vuex和localStorage实现vue菜单权限管理(笔记)
  5. paip.提升开发效率--终极方法---组件化及其障碍
  6. Android源码学习
  7. 准备好要上传到 Azure 的 Windows VHD 或 VHDX
  8. MMORPG大型游戏设计与开发(构架)
  9. 项目:艺龙国内机票实时数据爬虫
  10. 手把手搭建VuePress文档
  11. 【渝粤题库】陕西师范大学201931 唐诗研究 作业
  12. 中考考试的指令广播_2016中招考试广播指导语
  13. 成功路上并不拥挤 因为坚持的人不多
  14. Excel使用---excel2016___2维表转1维表(搬,侵删)
  15. XCTF-攻防世界CTF平台-Reverse逆向类——52、handcrafted-pyc(Python的pyc文件逆向)
  16. 【限时删除】一个惊艳的神器,可全网爬取各种资源..........
  17. 多域单点登录SSO系统的实现
  18. 审查元素html表格后缀,审查元素
  19. Golang:中“静态”方法
  20. spring security http.rememberMe()使用和原理解析

热门文章

  1. 智慧城市发展路径中 中国特色是主色调
  2. 爱快--虚拟机单网卡(带机上网)
  3. iOS SQLite语法基础
  4. MYSQL命令行常用命令
  5. OpenCV-矩阵变形reshape
  6. 华为机试HJ37:统计每个月兔子的总数(斐波那契数列)
  7. mysql三张表关联查询成绩表_mysql三张表关联查询
  8. db2判断字符为空_算法之字符串转换为数字
  9. 小程序实现分享图片_实现自己的图像识别,基于百度sdk的的图片识别项目
  10. python批量下载bilibili视频_如何批量下载bilibili的视频?