前言

随着大数据的快速发展,大数据应用已经融入各行各业。在很多场景中得到了商业化实践。今天和大家分享下58同城商业站内DMP平台架构与实践,介绍如何在大数据量的情况下进行实时数据挖掘并为在线广告系统应用提供物料等数据支持。

主要内容包括:

  • DMP 平台简介

  • DMP架构及实现

  • DMP应用

  • 未来规划

01DMP平台简介

DMP 其实是一个数据管理平台,是把分散的多方数据进行整合纳入统一的技术平台,并对这些数据进行标准化和细分,让用户可以把这些细分结果推向现有的互动营销环境里的平台。

业界代表性的产品有腾讯广点通和阿里达摩盘。它们主要提供创建细分人群、分析用户画像、种子用户群体拓展(lookalike)、再营销、分析投放管理、流量采买和第三方数据接入等功能。

下面和大家分享下58商业对DMP平台的需求。

1. 业务需求

58商业产品技术部主要负责整个58的商业变现,最核心的OKR其实是如何将有效的流量进行变现。

我们需要把点击广告的用户特征、上下文特征和我们自己的广告库特征进行加工整合后,再提供给在线广告推荐的触发、排序和装饰。其次还要支撑其他部门的商业营销、商家平台以及微聊系统。

深度学习核心技术精讲100篇(四十五)-商业DMP数据管理平台的架构与实践相关推荐

  1. 深度学习核心技术精讲100篇(十五)-搜索引擎Indri系列之安装及使用

    前言 Indri是Lemur项目衍生的一个基于语言模型的新的搜索引擎,由University of Massachusetts和Carnegie Mellon University合作开发. 安装 下 ...

  2. 深度学习核心技术精讲100篇(十九)--GBDT(梯度提升树) 和 Resnet (残差网络)的原理

    残差 残差在数理统计中是指实际观察值与估计值(拟合值)之间的差.在集成学习中可以通过基模型拟合残差,使得集成的模型变得更精确:在深度学习中也有人利用layer去拟合残差将深度神经网络的性能提高变强.这 ...

  3. 深度学习核心技术精讲100篇(十四)-一文带你看懂GPflow的前世今生

    什么是GPflow GPflow是一个高斯过程的工具包,接口部分由python实现,内部的部分计算则由Tensorflow实现. 主要特点有二个:一是使用变分推理作为近似方法,二是使用自动微分进行求导 ...

  4. 深度学习核心技术精讲100篇(十二)-DCGAN(对抗生成网络)算法应用及代码实现

    前言 一次偶然看到一个换脸的视频,觉得实在是很神奇,于是饶有兴致的去了解一下换脸算法.原来背后有一个极为有意思的算法思想--对抗生成. 随后各种各样的GAN算法以指数级增长的方式涌现出来,比如WGAN ...

  5. 深度学习核心技术精讲100篇(十)-机器学习模型融合之Kaggle如何通过Stacking提升模型性能

    前言 之前的文章中谈到了机器学习项目中,要想使得使得机器学习模型进一步提升,我们必须使用到模型融合的技巧,今天我们就来谈谈模型融合中比较常见的一种方法--stacking.翻译成中文叫做模型堆叠,接下 ...

  6. 深度学习核心技术精讲100篇(十六)-搜索引擎Indri系列之如何建立索引 (Indexing)检索评价 (Evaluation)

    前言 在为文档集建立索引时,需要执行IndriBuildIndex path-to-to-index_parameter_file.这里的index_parameter_file是xml格式的参数文件 ...

  7. 深度学习核心技术精讲100篇(十八)-巨量数据下美团是如何实现数据治理的?

    背景 大数据时代的到来,让越来越多的企业看到了数据资产的价值.将数据视为企业的重要资产,已经成为业界的一种共识,企业也在快速探索应用场景和商业模式,并开始建设技术平台. 但这里要特别强调一下,如果在大 ...

  8. 深度学习核心技术精讲100篇(二十四)-简单谈下深度学习在中文分词中的应用

    前言 随着深度学习的普及,有越来越多的研究应用新模型到中文分词上,让人直呼"手快有,手慢无".不过这些神经网络方法的真实水平如何?具体数值多少?以Sighan05中的PKU数据集为 ...

  9. 深度学习核心技术精讲100篇(二十)-如何通过树模型实现梯度提升树(GBDT)+LR,随机森林(RandomForest) +LR

    前言 在讲如何通过树模型做特征工程之前,首先让我们回顾一下一个机器学习(除去深度学习项目部分)项目的大致流程: 从业务场景中抽象出问题--分类问题,回归问题,还是聚类问题等, 接下来是数据获取,数据清 ...

  10. 深度学习核心技术精讲100篇(六)-keras 实战系列之知识蒸馏(Knowledge Distilling)

    前言 深度学习在这两年的发展可谓是突飞猛进,为了提升模型性能,模型的参数量变得越来越多,模型自身也变得越来越大.在图像领域中基于Resnet的卷积神经网络模型,不断延伸着网络深度.而在自然语言处理领域 ...

最新文章

  1. Realm_King 之 .NET操作XML完整类
  2. 通过正则寻找符合要求的字符串
  3. 小腿训练三部曲之(三)
  4. 连接CPU和计算机的总线,什么是计算机总线 总线和接口的区别
  5. mysql 连续签到天数_新版签到活动明天上线,福利活动抢鲜看~
  6. Visual C++ 2011-07-18
  7. 实验8 SQLite数据库操作
  8. 主备库内存不一致的Data Guard环境搭建全过程
  9. 平面2R机器人的运动学/动力学建模实例
  10. VirtualBox安装Windows XP图文教程
  11. 什么是索引?怎么创建索引?索引的使用原则?
  12. 信息技术基础2(课程笔记)
  13. Swift 基础 高阶函数 forEach filter map compactMap compactMapValues flatMap reduce sort sorted shuffled ...
  14. 解析海康摄像机推送的PS流
  15. python文件处理pdf_Python用于NLP :处理文本和PDF文件
  16. MNL(使用自己的数据集)
  17. Java:新世纪时代的召唤--启航
  18. 2019年云计算将有哪些变化?云计算未来前景
  19. 4412开发板UT-Exynos4412三星ARM四核旗舰开发平台android4.0GPS功能
  20. 使用稀疏 4D 卷积对 3D LiDAR 数据中的运动对象进行后退分割(IROS 2022)

热门文章

  1. 开源 java CMS - FreeCMS2.3 移动app站点配置
  2. ssh-keygen认证密钥
  3. 用C语言实现base64解密(包括二进制文件)
  4. 谷歌论文Weight Agnostic Neural Networks(WANN)权重无关神经网络
  5. 《第五项修炼——学习型组织的艺术与实务》读后感
  6. Struts2(四)
  7. 爆款AR游戏如何打造?网易杨鹏以《悠梦》为例详解前沿技术
  8. python 画图 实时_Python matplotlib实时画图案例
  9. 喜马拉雅数据接口 JSSDK API 接入 demo WEB版 标准登录 、免登陆
  10. Arcgis使用教程(九)ARCGIS空间数据符号化