目前,越来越多的企业,在大数据应用上,都会选择用户画像这一主题,为什么呢?因为用户画像相对于做推荐以及机器学习等简单容易的多,做画像,更多是就是对用户数据的整合,然后做一些用户聚类、用推荐算法,比如基于用户的推荐和基于商品的推荐,获取用户或者进行商品营销应用。

而在我们的实际应用中,不仅有用户画像,而且有关于物的画像,比如设备画像。然而,大多数情况下有一种常见的错误想法是画像维度的数据越多越好,画像数据越丰富越好,费了很大的力气进行画像后,却发现只剩下了用户画像,和业务相差甚远,没有办法直接支持业务运营,投入精力巨大但是回报微小,可以说得不偿失。鉴于此,我们的画像的维度和设计原则都是紧紧跟着业务需求去推动。换句话说,对于数据的应用就是基于业务来做的,业务和数据双向驱动。

本篇文章,并不过多介绍用户画像如果去做,而是去解决用户画像数据存储与快速检索的痛点,如果想仔细了解用户画像,推荐一篇博客:用户画像构建策略及应用实践

在实际的项目中,常用的用户画像数据存储除了常规关系型数据块外,应用比较多的是Hbase和Elasticsearch集群的快速检索。所以在实际使用时,如果选型,要根据具体的业务来选择。下面说说着种方式:

1. 基于Hbase的用户画像

直观的表达就是用Hbase集群来存储用户的数据,使用rowkey快速检索方式来构建查询。

博主曾经接触过一个项目,rowkey基于用户身份证号码设计,因为每个人的身份证就是独一无二的,在根据用户不同维度的信息给用户打标签,做分类到最后做画像。

2. 基于Elasticserch的用户画像

直观的表达就是用ES集群来存储用户的数据,使用ES快速检索方式来构建查询。

案例:携程 | 手把手教你用大数据打造用户画像

用户画像2种数据存储的方式相关推荐

  1. Android中的5种数据存储方式

    Android中的5种数据存储方式 Android中的5种数据存储方式 数据存储在开发中是使用最频繁的,在这里主要介绍Android平台中实现数据存储的5种方式,分别是: 1 使用SharedPref ...

  2. Android的5种数据存储方式概述

    Android有5种数据存储方式,具体分类如下: 1.应用内数据存储方式,程序外不可访问:SharedPreferences存储 应用场景:存储应用配置信息和常用信息. 获取SharedPrefere ...

  3. 数据存储方式有哪些?这3种数据存储方式了解吗?

    数据存储具有很强的现实意义,只有采取合理的数据存储方式,才能够有利于数据的管理.检索等.为增进大家对数据存储方式的认识,本文将对三种数据存储方式予以介绍.如果你对数据存储方式具有兴趣,不妨继续往下阅读 ...

  4. 用户画像与实时数据的架构及实践

    一.前言 知乎业务中,随着各业务线业务的发展,逐渐对用户画像和实时数据这两部分的诉求越来越多.对用户画像方面,期望有更快.更准.更方便的人群筛选工具和方便的用户群体分析能力.对于实时数据方面,期望拥有 ...

  5. 知乎用户画像与实时数据架构实践

    大家好,我是云祁! 今天和大家分享知乎侯容老师关于用户画像和实时数据架构实践的干货. 侯容:知乎数据赋能组 Leader,主要负责实时数据.用户理解方向. 一.前言 ‍‍‍‍‍‍‍‍知乎业务中,随着各 ...

  6. 【Doris】知乎用户画像与实时数据的架构与实践

    用户画像与实时数据分析是互联网企业的数据核心.知乎数据赋能团队以 Apache Doris 为基础,基于云服务构建高响应.低成本.兼顾稳定性与灵活性的实时数据架构,同时支持实时业务分析.实时算法特征. ...

  7. 前端图片有时候能显示有时候不显示_web前端基础教程:两种数据存储思路

    Web前端开发基础,Web前端基础教程 数据存储是数据流在加工过程中产生的临时文件或加工过程中需要查找的信息.数据以某种格式记录在计算机内部或外部存储介质上.数据存储要命名,这种命名要反映信息特征的组 ...

  8. Unity(游戏)中五种数据存储的方法

    Unity(游戏)中五种数据存储的方法 一.PlayerPrefs unity3d提供了一个用于本地持久化保存与读取的类-------PlayerPrefs.工作原理很简单,以键值对的形式将数据保存在 ...

  9. 几种数据存储结构详解

    分享一下我老师大神的人工智能教程!零基础,通俗易懂!http://blog.csdn.net/jiangjunshow 也欢迎大家转载本篇文章.分享知识,造福人民,实现我们中华民族伟大复兴! 影响空间 ...

最新文章

  1. arcgis的server不可用
  2. 关于python mysql
  3. 25.怎样在IDEA中使用JUnit4和JUnitGenerator V2.0自动生成测试模块
  4. 阿里云天池平台官方出品!从0到1层层拆解天池大赛赛题 | 文末送书
  5. flutter ios打包_使用 Travis CI 为 Flutter 项目打包 Android/iOS 应用
  6. Js获取字符串的显示宽度/高度
  7. 金蝶系统怎么清理服务器,【金蝶KIS专业版】如何注销加密服务器记录
  8. java 文件名乱码_详解关于java文件下载文件名乱码问题解决方案
  9. 一起来学习BERT常见的几个变体
  10. mysql 图文安装_mysql安装图解mysql图文安装教程(详细说明)
  11. 长链接转短链接 在线工具详细教程——附上各大短网址性能详细评测
  12. C++编译错误总结及其英文翻译————墨白
  13. 挨踢人生路--记我的10年18家工作经历 续 .转
  14. 7类 登录/注册 安全漏洞
  15. 转:我,喜,欢,你,很久了……
  16. 5G NR协议栈及功能2 - MAC RLC PDCP SDAP
  17. 【Lintcode】1647. Path Search
  18. 借助GitHub pages搭建静态个人网站并绑定域名
  19. 排队论(Queuing theory)简介
  20. D1net阅闻:甲骨文考虑收购市值775亿美元的埃森哲

热门文章

  1. 【测试点三、四、五分析】1032 Sharing (25 分)_28行代码AC
  2. Java 折半查询,java之折半查询
  3. c语言入门教程文库,C语言入门教程(全集)课件
  4. java上传文件至nas_使用JCIFS上传文件至NAS设备(Logon failure: unknown user name or bad password)解决...
  5. 智能水杯设计方案_智能水杯盖方案开发
  6. 先来先服务算法代码_一致性哈希算法编写
  7. 虚拟机下Ubuntu共享主机文件(Ubuntu、VMware、共享) .
  8. python从mysql导出大量数据_python批量导出导入MySQL用户的方法
  9. pycharm导入jieba包_3分钟带你搞懂Python模块、包的区别和使用
  10. 物流设计大赛优秀作品_重磅!312支高校战队入围!谁主第六届全国大学生物流设计大赛复赛...