前言

用户画像作为当下描述分析用户、运营营销的重要工具,被全部互联网人熟知,用户画像的定义并不复杂,是系统通过用户自行上传或埋点上报收集记录了用户大量信息,为便于各业务应用,将这些信息进行沉淀、加工和抽象,形成一个以用户标志为主key的标签树,用于全面刻画用户的属性和行为信息,这就是用户画像。

画像这种结构化的用户信息加工方式,极大程度上做到了完整、全面且直观地刻画用户。画像是用户在产品的档案,便于人工使用、机器输入和算法理解。简而言之:画像是由标签树及末级标签的标签值构成的,全面定量刻画用户的结构化信息产品。画像是标签的总成,用户标签是具体刻画用户的结构化信息,以下简称标签。

本文将介绍用户画像的构建思路,在画像构建的过程中,我们把工作分为两步:

  • 第一步:介绍从0到1的构建思路。

  • 第二步:介绍从1到100的构建思路。

1. 画像从0到1的构建思路

一个比较成熟的画像系统,会有成千上百的标签,这些标签的生产不是一次完成的,而是随着业务的发展需要,逐步补充完善,最终呈现在大家眼前的就是一棵庞大的标签树。

跟自然界的树木一样,要想长得茁壮参天,必须有一个稳定的根基和合理的结构,用户画像的构建也是一样的,前期最重要的仍然是搭好画像骨架,确保后续的发展过程中,依然保持清晰的结构和高延展性。相反的,如果一开始为了抢时间,将大量标签无序的堆在线上,后期管理和使用的难度会迅速凸显出来,重构的代价巨大。

上面说到,一个好的标

深度学习核心技术精讲100篇(五十二)-用户画像系统构建全思路解析相关推荐

  1. 深度学习核心技术精讲100篇(十二)-DCGAN(对抗生成网络)算法应用及代码实现

    前言 一次偶然看到一个换脸的视频,觉得实在是很神奇,于是饶有兴致的去了解一下换脸算法.原来背后有一个极为有意思的算法思想--对抗生成. 随后各种各样的GAN算法以指数级增长的方式涌现出来,比如WGAN ...

  2. 深度学习核心技术精讲100篇(十九)--GBDT(梯度提升树) 和 Resnet (残差网络)的原理

    残差 残差在数理统计中是指实际观察值与估计值(拟合值)之间的差.在集成学习中可以通过基模型拟合残差,使得集成的模型变得更精确:在深度学习中也有人利用layer去拟合残差将深度神经网络的性能提高变强.这 ...

  3. 深度学习核心技术精讲100篇(十五)-搜索引擎Indri系列之安装及使用

    前言 Indri是Lemur项目衍生的一个基于语言模型的新的搜索引擎,由University of Massachusetts和Carnegie Mellon University合作开发. 安装 下 ...

  4. 深度学习核心技术精讲100篇(十四)-一文带你看懂GPflow的前世今生

    什么是GPflow GPflow是一个高斯过程的工具包,接口部分由python实现,内部的部分计算则由Tensorflow实现. 主要特点有二个:一是使用变分推理作为近似方法,二是使用自动微分进行求导 ...

  5. 深度学习核心技术精讲100篇(十)-机器学习模型融合之Kaggle如何通过Stacking提升模型性能

    前言 之前的文章中谈到了机器学习项目中,要想使得使得机器学习模型进一步提升,我们必须使用到模型融合的技巧,今天我们就来谈谈模型融合中比较常见的一种方法--stacking.翻译成中文叫做模型堆叠,接下 ...

  6. 深度学习核心技术精讲100篇(十六)-搜索引擎Indri系列之如何建立索引 (Indexing)检索评价 (Evaluation)

    前言 在为文档集建立索引时,需要执行IndriBuildIndex path-to-to-index_parameter_file.这里的index_parameter_file是xml格式的参数文件 ...

  7. 深度学习核心技术精讲100篇(十八)-巨量数据下美团是如何实现数据治理的?

    背景 大数据时代的到来,让越来越多的企业看到了数据资产的价值.将数据视为企业的重要资产,已经成为业界的一种共识,企业也在快速探索应用场景和商业模式,并开始建设技术平台. 但这里要特别强调一下,如果在大 ...

  8. 深度学习核心技术精讲100篇(五十八)- 如何量化医学图像分割中的置信度?

    前言 在过去的十年里,深度学习在一系列的应用中取得了巨大的成功.然而,为了验证和可解释性,我们不仅需要模型做出的预测,还需要知道它在做出预测时的置信度.这对于让医学影像学的临床医生接受它是非常重要的. ...

  9. 深度学习核心技术精讲100篇(三十五)-美团餐饮娱乐知识图谱——美团大脑揭秘

    前言 " I'm sorry. I can't do that, Dave." 这是经典科幻电影<2001: A Space Odyssey>里HAL 9000机器人说 ...

最新文章

  1. 关闭iptables和SELINUX
  2. 计算机文化基础课程总结,计算机文化基础课程总结.docx
  3. 大连开发区取暖费能微信支付吗_下半年教资报考人数增加,那到底能不能异地报考呢?...
  4. MySQL(7)索引
  5. mysql简单增删改查(CRUD)
  6. android sdk离线安装
  7. 关于java中数据类型叙述正确的是( )_关于Java中数据类型叙述正确的是:
  8. python的浮点数占字节_Python二进制文件读取并转换为浮点数详解
  9. 关于电脑前置耳机插孔没声音的问题
  10. 常用cmd操作Redis的命令
  11. 推荐一款Mac远程桌面工具——Parallels Client(免费)
  12. 计算机工程师相关政策,计算机中级工程师论文发表(发表时机和要求)
  13. 侦听器watch及其和计算属性、methods方法的总结
  14. 前端实例1——blog页面(css样式)
  15. Python-opencv实现Trackbar调节亮度对比度
  16. 【联盛德W806上手笔记】八、SPI及其DMA
  17. Django笔记 CMS框架Mezzanine 1
  18. 网易云音乐用户微观洞察精细化运营
  19. vim删除文本的命令
  20. P2P终结者---控制整个局域网网络的管理软件

热门文章

  1. git cherry-pick简介
  2. 架构师速成7.2-为什么要学习协议、规范
  3. 希望增加的BLOG功能——GOOGLE广告
  4. foxmail使用技巧
  5. 算法提高课-搜索-Flood fill算法-AcWing 1106. 山峰和山谷:flood fill、bfs
  6. 《公司理财》_16章_2.财务杠杆学习笔记
  7. 论文公式编号右对齐_word技能之添加样式以及公式自动编号
  8. 单曲循环 翻译_有没有那么一首歌是你的单曲循环?
  9. python制表符什么意思_python中制表符是什么意思
  10. 快速mysql导入sql文件_mysql肿么快速从sql文件导入数据库