如果说互联网的目标就是连接一切,那么推荐系统的作用就是建立更加高效的连接了。

不得不说抖音的推荐系统,太厉害了。刷了啥,立刻记住你的偏好,推荐相似内容,一不小心 2 小时就过去了,让人欲罢不能,要么日活 6 亿呢。

其实“推荐系统”从没像现在这样,影响着我们的生活。除了抖音、快手这类短视频,还有网购时,天猫、京东会为你推荐商品;想看看资讯,头条、知乎会为你准备感兴趣的新闻等等。

而驱动这些巨头进行推荐服务的,都是基于深度学习的推荐模型。

想起 2019 年阿里的千人千面系统,促成了天猫“双 11” 2684 亿成交额。假设通过改进商品推荐功能,使平台整体的转化率提升 1%,就能在 2684 亿成交额的基础上,再增加 26.84 亿。这就是推荐工程师的最牛的地方,也是为啥人能拿百万年薪的原因。

但在一个成熟的推荐系统上,找到提升的突破点并不容易——不能满足于协同过滤、矩阵分解这类传统方法,而要建立起完整的“深度学习推荐系统”知识体系,加深对深度学习模型的理解,以及大数据平台的熟悉程度,才能实现整体效果上的优化。

所以假期除了刷抖音,我又重新看了看《深度学习推荐系统》这个专栏,2 刷有不少新的启发。作者王喆,Roku 推荐系统架构负责人,也是咱圈里的大佬,一直深耕在推荐系统、计算广告领域,经验非常丰富。他之前出过同名的书,豆瓣评分 9.3,相当高。

当年我看书的时候,就感觉实践太少,偏模型原理。所以在听说王喆开了个实践专栏时,第一时间就订阅了,跟着学下来,受益匪浅。让我完整地把推荐系统的原理捋了一遍。下面王喆总结的「核心知识图谱」,建议收藏。

最重要的是,实操性特别强。王喆特地为了这个专栏,开发了一个开源项目「 SparrowRecsys」,能让你亲手尝试,搭建一套完整的深度学习推荐系统(下面有详细介绍,贼有意思)。可以说是书的实践版本,里面加入了更多技术细节的实现和讨论。

毫不夸张的说,这个专栏让我对深度学习推荐系统的认知,提升到了一个新高度,所以很想把它推荐给你,扫码免费试读????

限时秒杀+口令「happy2021」

到手仅 ¥89 ,原价 ¥129

新用户到手仅 ¥59.9

王喆这课,为啥值得买?

先来说说这个 SparrowRecsys 推荐系统。王喆把它叫做“麻雀推荐系统”,取“麻雀虽小、五脏俱全”之意,它利用了开源的 movielens 数据集,搭建起了包括:

Spark、Flink 特征工程

TensorFlow 深度学习模型训练

TensorFlow Serving 模型服务

Redis 在线特征数据库

Jetty Server 推荐服务器

JS 前端实现

以上这些在内的,一整套深度学习推荐系统。不说它能支撑起一个中大型公司的推荐系统,但是毫无疑问,它可以成为一个工业级推荐系统的种子项目。而这一切,都能在课程里,一步步尝试搭建起来。

最后你实现的推荐系统会是这个样子????

SparrowRecSys的首页

SparrowRecSys的相似电影推荐页

在这些前端页面的背后,是你能实现的一个又一个深度学习模型

  • 对于电影的相似推荐功能,王喆会使用各种 Embedding based 的方法,比如 item2vec,graph embedding 等等。

  • 对于推荐功能,会基于 TensorFlow 实现Embedding MLP,Wide&Deep,NerualCF,Two Towers,DeepFM,DIN 等等深度学习模型,然后使用 TensorFlow serving 去进行模型服务。

  • 对于召回层、排序层这些推荐逻辑,也会全盘在基于 Jetty 的推荐服务器中实现。

整个项目整体的技术架构是下面这个样子的:

SparrowRecSys的技术架构

是不是感觉很牛。其次,专栏本计划是 30 讲,生生写到 43 讲,补充讨论了很多热门的问题。在这里贴 15 个专栏里讨论的问题,看专栏留言区的讨论,感觉收获更大。

最后说说,他是怎样讲解这门课程的?

整体遵循了经典推荐系统的框架,分为 6 部分,学懂了,实现一个工业级的深度学习推荐系统,不成问题,简单介绍下:

基础架构篇:讲要从 0 开始实现的推荐系统, Sparrow RecSys 的主要功能和技术架构,也会用到 Spark、Flink、TensorFlow 等业界最流行的机器学习和大数据框架。

特征工程篇:讨论推荐系统会用到的特征,以及主要的特征处理方式,并将其实践在 Spark 上。此外,还有深度学习中非常流行的 Embedding、Graph Embedding 技术,并带你实现 Sparrow Recsys 中的相似电影推荐功能。

线上服务篇:带你搭建一个推荐服务器,包括服务器、存储、缓存、模型服务等模块和相关知识,涉及 Jetty Server, Spark、Redis 的使用。

推荐模型篇:深度学习推荐模型的原理和实现方法,包括 Embedding+MLP ,Wide&Deep,PNN 等深度学习模型的架构和 TensorFlow 实现,以及注意力机制、序列模型、增强学习等相关领域的前沿进展。

效果评估篇:效果评估的主要方法和指标,建立起包括线下评估、线上 AB 测试、评估反馈闭环等整套的评估体系,真正能够用业界的方法,而不是实验室的指标来评价一个推荐系统。

前沿拓展篇:讲 YouTube、阿里巴巴、微软、Pinterest 等一线公司的深度学习应用,帮你追踪业界发展的最新趋势。

目录也放这儿了????

可以说,王喆老师的书也好,课也好,从未叫人失望过,而且他人也特别 nice,经常在专栏下面跟读者留言互动,这种耐心和责任心,真不是一般人有的。

????扫码免费试读

限时秒杀+口令「happy2021」

到手仅 ¥89 ,原价 ¥129

新用户到手仅 ¥59.9

没计划的学习,都只是作秀。与其花时间找一堆资料,还不如有计划的消化一个系统的课,更值。

????点击「阅读原文」,新用户 ¥59.9 就能拿下。

抖音日活用户破 6 亿,推荐系统到底有何魔力?相关推荐

  1. 互联网日报 | 抖音日活用户破6亿;苹果秋季发布会iPhone 12缺席;有赞正式入局支付宝小程序...

    今日看点 ✦ 抖音宣布日活跃用户破6亿,未来一年让创作者收入800亿 ✦ TikTok:已向美国政府提交解决方案,相信可以解决安全顾虑 ✦ 百度CTO王海峰发布百度大脑6.0,AI新基建加速产业智能化 ...

  2. 互联网日报 | 华为鸿蒙OS 2.0正式发布;微信小程序日活用户超4亿;百胜中国回港上市首日破发...

    今日看点 ✦ 微信小程序最新数据:日活用户超4亿,相关从业者达536万 ✦ 华为鸿蒙OS 2.0正式发布,明年华为手机全面支持 ✦ 百胜中国回港二次上市首日破发,总市值超1600亿港元 ✦ 华住集团通 ...

  3. 互联网日报 |《王者荣耀》日活用户平均1亿;四部门联合约谈蚂蚁集团有关人员;“百度云手机”旗舰版发布...

    今日看点 ✦ 袁隆平团队双季稻亩产超1500公斤,再破世界纪录 ✦ 菜鸟核心系统全面上云,将实现日均处理10亿包裹 ✦ 百度正式发布"百度云手机"旗舰版:30天月卡售价77元 ✦ ...

  4. 最近很火的计算机歌曲,抖音日活跃用户数超4亿 2019年度最火音乐竟是它

    抖音今日发布<2019抖音数据报告>(以下简称报告),报告显示,截至2020年1月5日,抖音日活跃用户数超过4亿. 根据报告,抖音上不同年龄段用户最爱拍摄的内容不尽相同,00后喜欢拍摄二次 ...

  5. Facebook入局视频会议,日活用户超3亿的Zoom股价应声下跌,Zoom为何不扛打?

    全球社交媒体巨头Facebook上周五宣布,将推出新视频会议产品Messenger Room,供用户免费使用. 受此消息影响,疫情期间增长最快的视频会议软件服务Zoom股价出现大幅震荡:从增长超6%, ...

  6. 抖音日活3.2亿,可能有 3.3亿用户在同一天内使用抖音吗?(泊松分布的Python实现)

    今年7月9日,抖音官方宣布抖音APP的日活达到3.2亿.在没有详细公开数据的情况下,假设这是抖音App 6月份的平均日活跃用户数.那么在6月份平均日活跃用户数3.2亿的情况下,有可能某天有3.3亿用户 ...

  7. 微软Bing Chat全面开放,所有人可用!官宣多项重大升级,日活用户超过1亿

    来源:AI前线 作者:冬梅 当地时间 5 月 4 日,根据 The Verge 报道,微软宣布公司旗下基于 ChatGPT-4 的 Bing Chat 功能已进入开放预览(Open Preview)模 ...

  8. Python爬虫-抖音日活之日排行榜单,周排行榜单

    前言 本文是该专栏的第31篇,后面会持续分享python的爬虫干货知识,记得关注. 众所周知,抖音目前是款日常消遣时间日活非常大的产品,但有些媒介平台会统计它的日活指数,比如日榜单,周榜单.而本文这里 ...

  9. 哔哩哔哩增收不增利:上市后连续12个季度亏损,月活用户破2亿

    2月25日,哔哩哔哩(NASDAQ: BILI,也称"B站")公布了截至2020年12月31日的第四季度和全年未经审计的财务报告.截至报告期末,哔哩哔哩仍处于亏损状态. 财报显示, ...

最新文章

  1. java获取下一季末_java取当前周期、月初至月末、季度初至季度末日期。
  2. 基于深度神经网络的图像缺损修复方法综述
  3. php 单例类 mysql pdo_PHP实战:PHP基于单例模式编写PDO类的方法
  4. neural network ppt for support vector machine
  5. Hystrix中的批量(折叠)请求
  6. thinkphp-page
  7. 7-4 组从配置-操作
  8. resnext50_32x4d-inference
  9. 化妆品行业组合解决方案
  10. 嵌入式软件工程师总结(1)
  11. 常见汉字与不常见汉字
  12. 机器学习与量化交易项目班 [从零搭建自动交易系统]
  13. 有关微信小程序云数据库修改数据的坑
  14. 为什么《百家讲坛》上的中学教师收视率最高?
  15. STM32L4超低功耗特性概述
  16. 合成孔径雷达干涉测量InSAR数据处理、地形三维重建、形变信监息提取、测
  17. 视频 | 太壮观了!阿尔乌拉打破全球最大热气球发光表演纪录
  18. 区块链产物 的安全是否真的无懈可击!
  19. 在Linux/Unix系统下用iconv命令处理文本文件中文乱码问题
  20. CCIE自学-by闫辉NP视频:MPLS小结

热门文章

  1. Android 网卡地址Mac Wifi文件
  2. PHP_常用字符串处理函数
  3. Android之关于图表
  4. java中图片和字节数组相互转化
  5. cmake使用示例与整理总结_QTVLC的博客-CSDN博客_cmake使用示例与整理 施公队演示时用的blog B zhan
  6. PyTorch手把手自定义Dataloader读取数据
  7. HSV的数据结构各分量H S V的直观理解其实就是对应图片位置的的像素一一对应的矩阵表示
  8. 西湖大学蓝振忠:预训练语言模型的前沿发展趋势
  9. 大型Web前端架构设计:面向抽象编程入门
  10. 还原黑客电影中那些Hacking技术的真相