企业级360°全方位用户画像:项目介绍[二]
絮叨两句:
博主是一名软件工程系的在校生,利用博客记录自己所学的知识,也希望能帮助到正在学习的同学们
人的一生中会遇到各种各样的困难和折磨,逃避是解决不了问题的,唯有以乐观的精神去迎接生活的挑战
少年易老学难成,一寸光阴不可轻。
最喜欢的一句话:今日事,今日毕
页数 | 名称 |
---|---|
上一页 | 企业级360°全方位用户画像:用户画像概念[一] |
企业级360°全方位用户画像:项目介绍[二] | |
下一页 | 企业级360°全方位用户画像:项目工程演示[三] |
文章目录
- 前言
- 项目介绍
- 1.功能模块
- 1.1模块介绍
- 2.技术架构
- 3.标签梳理
- 3.1 标签定义依据
- 3.2标签体系需求分析
前言
企业级360°全方位用户画像是基于电商平台进行设计和开发,是面向注册会员的偏好、行为习惯和 人口属性的画像还原,同时也包括对商品信息的画像还原。**提供用户喜好和商品特征帮助营销平台提升 营销的精准度
,也方便个性化推荐系统快速准确的为每个用户推荐相关的商品
。
提示:以下是本篇文章正文内容,若有纰漏及时反馈纠正
项目介绍
项目名称:企业级360°全方位用户画像
行业领域:电商平台,针对电商平台用户构建用户画像,给用户打标签
构建画像:
1)、注册会员(打标签) - 用户标签
a)、偏好:订单数据
依据订单数据、购物车数据和收藏数据构建标签
b)、行为习惯:流量数据、搜索数据
依据浏览数据,构建标签
c)、人口属性:用户注册信息数据
对用户基本信息构建标签
2)、商品信息(打标签) - 商品标签
订单数据构建商品的标签
标签存储:将用户标签数据存储到HBase表中
表名称:
tbl_profile
ROW_KEY:
userId
列簇ColumnFamily:
用户标签列簇:user
商品标签列簇:item
列值:
标签的ID集合:tagIds -> 384,392,376,.....
回顾:
在HBase Shell命令行中如何创建用户标签表呢?
create 'tbl_profile', 'user', 'item' -> 此种方式创建表的只有一个分区Region
创建表的时候,考虑数据的预分区和预测压缩
画像功能:
1)、精准营销
2)、个性化推荐
1.功能模块
整个项目分为如下几个功能模块,具体描述:
1.1模块介绍
画像模块:
个体画像 -> 【微观画像】
依据用户ID:userId,查询用户所用标签,进行展示
群体画像 -> 【标签查询】
依据多个标签组合(OR、AND)查询用户,属于某个群体,分不同类
1、标签体系:
标签体系模块基于本体论建立,包括基础标签和组合标签两个子模块。基础标签维护了人口属性、 商业属性、行为属性和用户价值4个方面。组合标签是在基础标签的基础上按TGI创建的,用于反映目标 群体在特定研究范围的强势和弱势。2、标签引擎
标签引擎模块是用户画像运转的核心实现,维护标签的具体实现逻辑,包括标签依赖的数据源、规 则和模型的信息。同时提供每一个标签引擎运行状态的可视化监控。当Super User登录时会出现新增标 签及其引擎的审核。3、画像模块
画像模块是对实体(用户/物品)信息全貌可视化的精准还原,包括对个体的全方位还原和群体的 全方位还原。4、标签查询
标签查询模块是查看标签所覆盖的实体,用于查看标签体系中所有标签包含的商品详细信息和经过脱敏后的用户信息。5、系统设置
系统设置模块主要包括用户管理、权限管理。
2.技术架构
项目的总体架构图:
软件版本:
jdk1.8.0_221
hadoop-2.6.0-cdh5.14.0
hbase-1.2.0-cdh5.14.0
zookeeper-3.4.5-cdh5.14.0
spark-2.2.0-bin-2.6.0-cdh5.14.0
sqoop-1.4.6-cdh5.14.0
apache-flume-1.6.0-cdh5.14.0-bin
solr-4.10.3-cdh5.14.0
oozie-4.1.0-cdh5.14.0
hue-3.9.0-cdh5.14.0安装目录:/export/servers
系统用户:root/123456实际项目使用CDH版本大数据框架版本,使用HDP 大数据框架版本HDP 2.x版本
项目功能架构图:
3.标签梳理
学习目标:
能够了解本体论
能够掌握标签的分类和业务背景
3.1 标签定义依据
知识工程(本体论)的概念最早由美国斯坦福大学计算机科学家费根鲍姆提出。
他认为“知识工程是人工智能的原理和方法
为那些需要专家知识才能解决的应用难题提供求解的手段
恰当运用专家知识对获取、表达、和推理过程做出解释,是设计知识系统的关键问题”。
基于知识工程的用户定性画像中
核心思想是利用本体对用户画像中的标签进行表示、验证、推理和解释。
本体论(Ontology)是哲学上的一个学科,是研究客观事物存在和组成的通用理论。
    本体的结构包括[类、属性、实例、公理和推理规则]
1)、类:Thing为本体中所有类的父类,如酒类。2)、属性:每个类都有属性,在酒类当中包括:白酒、啤酒、红酒等属性。3)、实例:指类的具体对象,如茅台酒、二锅头酒。4)、公理:本体中的永真式,描述类的约束条件,该条件在某个领域中是永远成立的。例如茅台酒厂生产的酒就是茅台酒,这个公理即永远成立。5)、推理规则:本体所在领域以专家知识的形式化表示,用于保证本体的完整性和一致性。
3.2标签体系需求分析
标签体系是根据已注册用户的偏好、行为习惯和人口属性等不同的领域进行建立的
按领域可以分为
- 人口属性
- 商业属性
- 行为属性和
- 用户价值
按具体的实现方式分为
- 规则标签
- 统计标签
- 挖掘标签
- 在本项目中标签体系按照业务类型划分为基础标签和组合标签。
按领域划分
按实现方式划分
按照业务类型划分
业务标签一:人口属性
业务标签二:商业属性
业务标签三:行为属性
业务标签四:用户价值
如能帮助到你或对大数据有兴趣的可以关注一下,希望能点个赞支持一下谢谢!
企业级360°全方位用户画像:项目介绍[二]相关推荐
- 企业级360°全方位用户画像:标签系统[四]
絮叨两句: 博主是一名软件工程系的在校生,利用博客记录自己所学的知识,也希望能帮助到正在学习的同学们 人的一生中会遇到各种各样的困难和折磨,逃避是解决不了问题的,唯有以乐观的精神去迎接生活的挑战 少年 ...
- Profile_Day05:企业级360全方位用户画像
Profile_Day05:企业级360全方位用户画像 1昨日内容回顾 主要讲解2个方面的内容: 如何基于SparkSQL实现自定义外部数据源HBase和统计类型标签模型开发. 1, SparkSQL ...
- 大数据【企业级360°全方位用户画像】之USG模型和决策树分类算法
在之前的一篇博客<大数据[企业级360°全方位用户画像]之RFM模型和KMeans聚类算法>中,博主为大家带来了KMeans聚类算法的介绍.并在之后,基于不同的模型开发标签,例如RFM,R ...
- 企业级360°全方位用户画像
用户画像概念.项目概述及环境搭建 1.用户画像 1.1.概念 什么是用户画像? 百度百科定义 用户画像又称用户角色,作为一种勾画目标用户.联系用户诉求与设计方向的有效工具,用户画像在各领域得到了广泛的 ...
- 企业级360°全方位用户画像:环境搭建[五]
絮叨两句: 博主是一名软件工程系的在校生,利用博客记录自己所学的知识,也希望能帮助到正在学习的同学们 人的一生中会遇到各种各样的困难和折磨,逃避是解决不了问题的,唯有以乐观的精神去迎接生活的挑战 少年 ...
- 大数据【企业级360°全方位用户画像】业务数据调研及ETL
写在前面: 博主是一名大数据的初学者,昵称来源于<爱丽丝梦游仙境>中的Alice和自己的昵称.作为一名互联网小白,写博客一方面是为了记录自己的学习历程,一方面是希望能够帮助到很多和自己一样 ...
- 大数据【企业级360°全方位用户画像】项目介绍
在正式开始对[企业级用户画像]项目展开介绍之前,博主可是煞费苦心,为大家整理了一期,如何彻底理解什么是用户画像(
- 大数据【企业级360°全方位用户画像】标签系统介绍
在前面几篇博客中,博主已经为大家带来了什么是用户画像,以及项目的一个基础介绍.用户画像的核心就是打标签,本篇博客,我们来聊聊关于这个项目的标签系统. 文章目录 1. 标签系统 1.1 基础标签 1.1 ...
- 大数据【企业级360°全方位用户画像】匹配型标签开发
写在前面: 博主是一名大数据的初学者,昵称来源于<爱丽丝梦游仙境>中的Alice和自己的昵称.作为一名互联网小白,写博客一方面是为了记录自己的学习历程,一方面是希望能够帮助到很多和自己一样 ...
最新文章
- 用Java对HashMap排序
- wxpython如何分开界面和运行代码_如何调试wxPython Demon源代码及几个细节
- 如何制作自己的Visio图标
- 如何扒取整站网页----扒站神器(Mac版跟window版)
- 日骗上百的淘宝网赚项目骗局
- MySql存储含有特殊符号的微信昵称
- ubuntu格式化硬盘
- 加密流量分类-论文2:Deep Packet: A Novel Approach For Encrypted Traffic Classification Using Deep Learning
- golang之jsonb类型的支持
- 最新最全论文合集——纵向联邦学习
- MySQL关系运算和连接运算,数据库的关系运算和完整性约束
- 引进国外SD-WAN技术,凌锐蓝信为企业提供跨境网络连接服务
- 我学会了用计算机作文,我学会了电脑作文
- vmware启动虚拟机提示“无法连接虚拟设备ide1:0,主机上没有相对应的设备“
- 关于数据中台、数据平台、数据仓库、数据湖等数据概念的对比解析
- POI将excel表中信息读取,并且处理输出到一个新excel表中。
- 多个List 如何取并集、交集
- c语言200例 040 字符升序排列
- 代码审计(入门篇)-- 牛马留言板代码审计
- NYOJ---1131买水果