数仓建模—ID Mapping(下)
ID Mapping(下)
上一节我们已经讲过什么是ID Mapping 了,顾名思义我们知道ID Mapping 的操作对象是ID,目标或者是动作是Mapping,也就是说我们要做的事情其实就是想把不同平台不同设备上的ID 打通,从而更好的去刻画用户,也就是说我们希望能打通用户各个维度的数据,从而更好的去服务业务服务用户。
上一节我们讲了常见的ID,例如登陆ID、设备ID 还有例如身份证号、手机号码等一些列的ID,都可以去标示一个用户,接下来我们就看一下如何去做ID Mapping,关于理论我们不多说。
这里有一点要说一下ID Mapping 做完之后我们就会做One ID ,也就是说我们为这些Mapping 上的ID 生成一个新的ID,这个ID 就是One ID,也就是说当我们的One ID 生成之后我们就可以使用这个ID 来打通所有的业务系统,关于One ID 可以参考下一篇文章。
ID Mapping 的难点
- 各个平台和各个设备ID 无法直接关联,所以要想关联需要找到关联对象,用SQL 举例就是如果你要想把 A 和 C关联起来,你必须找到可以同时和它们可以关联起来的B,而我们的用户ID 非常多,所以要想关联起来你不止要梳理清楚关联关系,而且你还得写大量的关联代码
- 时间问题,有些数据可能属于同一个人,但在某个阶段上,这些数据之间没有任何联系,那么这人的数据可能会被打上两个不同的标识,也就是说你需要在某一刻同时获得这些信息,但是这又是非常困难的。
图计算实现 ID Mapping
图计算(Graph Computing)在金融
数仓建模—ID Mapping(下)相关推荐
- 大数据数仓建模(3)
大数据数仓建模(3) 2.2.6 人员配置参考 1.旁敲侧击的问你到底做过没有 2.你们大概规模,数据量 1整体架构 属于研发部/技术部/数据部/基础平台部,我们属于大数据组,其他还有后端项目组,前端 ...
- 浅谈数仓建模及其方法论
认识数据仓库 1.数仓的定义: 2.数据仓库和数据库的区别: 数仓的发展 1.简单报表阶段:这个阶段,系统的主要目标是解决一些日常的工作中业务人员需要的报表,以及生成一些简单的能够帮助领导进行决策所需 ...
- 数仓建模(维度建模)
目录 一.什么是建模?(为什么建模) 二.模型的好处 三.建模的方法 四.维度建模 4.1 基本概念 4.2 为啥选择维度建模(优缺点) 4.2.1 优点 4.2.2 缺点 4.3 维度建模-星型模型 ...
- (转载)通俗易懂数仓建模—Inmon范式建模与Kimball维度建模
在数据仓库领域,有两位大师,一位是"数据仓库"之父 Bill Inmon,一位是数据仓库权威专家 Ralph Kimball,两位大师每人都有一本经典著作,Inmon大师著作< ...
- 数仓建模—分层建设理论(03)
文章目录 分层建设理论 分层的意义 清晰数据结构体系 数据血缘追踪 减少重复开发和资源浪费 复杂问题简单化 统一数据口径 提高数据质量 关于分层的一点思考 数仓的分层 ods 操作数据层 设计原则 D ...
- 离线数仓(三)数仓建模基本理论
1.建模目标 数据模型就是数据组织和存储方法,它强调从业务.数据存取和使用角度合理存储数据.Linux的创始人Torvalds有一段关于"什么才是优秀程序员"的话:"烂程 ...
- 数仓建模—增量数据处理
增量数据处理 这一节我们不讲技术,讲一个故事,关于数据同步这一块的落地方案可以参考我们之前的文章 数仓建模-数据集成 数仓建模-数据同步方案设计 数仓建模-美团DB数据同步到数据仓库的架构与实践 因为 ...
- 数据仓库(3)数仓建模之星型模型与维度建模
维度建模是一种将数据结构化的逻辑设计方法,也是一种广泛应用的数仓建模方式,它将客观世界划分为度量和上下文.度量是常常是以数值形式出现,事实周围有上下文包围着,这种上下文被直观地分成独立的逻辑块,称 ...
- 数仓建模—数仓架构发展史(02)
发展史 时代的变迁,生死的轮回,历史长河滔滔,没有什么是永恒的,只有变化才是不变的,技术亦是如此,当你选择互联网的那一刻,你就相当于乘坐了一个滚滚向前的时代列车,开往未知的方向,不论什么样的技术架构只 ...
- 数仓 建模思想之星型模型、雪花模型、星座模型
数仓 建模思想之星型模型.雪花模型.星座模型 1. 背景 在大数据开发中,数据一般是分为事实表,维度表,实体表等表. 事实表顾名思义就是记录实际发生的事情如订单表,优惠券使用表等等. 维度表,顾名思义 ...
最新文章
- 驱动华为_再补齐一个短板,华为正式宣布进军屏幕驱动行业
- ACM公选课第五节贪心4.14-5.4补+第六节上贪心线段覆盖
- 解决UnicodeDecodeError: ‘ascii’ codec can’t decode byte 0xe5 in position 108: ordinal not in range(12
- android获取控件宽度高度
- 进程与线程的区别(面试题)
- 《天天数学》连载04:一月四日
- 成都信息工程大学c语言题库,成都信息工程学院C语言考试题及答案.docx
- 昨天晚上的总结--人跟人的区别在于想的多少吧
- 简单的BBcode parsing
- 标题利用pwdump、lc7、hashcat工具破解用户口令(基于win7环境下)
- voip 软电话 客户端实例 SIP
- 常见的四种计量标识及其含义(CNAS / ILAC / CMC / CMA)
- 每日一题——孪生素数对(教你如何高效判断素数,判断素数的全部方法)
- 【网络编程】一、如何记住OSI七层协议模型,看完还记不住的来打我。
- 论文浏览(27) Long-Term Feature Banks for Detailed Video Understanding
- 社交平台上的“引流”黑色产业链:“假聊”获粉,精准割韭菜
- 企业营销培训讲座在线观看目录
- cocos2dx以前的一些文章的项目下载地址
- 怎样在cmd(命令提示符)下快速进行复制粘贴操作
- IDEA运行报Command line is too long错误解决办法