ID Mapping(下)

上一节我们已经讲过什么是ID Mapping 了,顾名思义我们知道ID Mapping 的操作对象是ID,目标或者是动作是Mapping,也就是说我们要做的事情其实就是想把不同平台不同设备上的ID 打通,从而更好的去刻画用户,也就是说我们希望能打通用户各个维度的数据,从而更好的去服务业务服务用户。

上一节我们讲了常见的ID,例如登陆ID、设备ID 还有例如身份证号、手机号码等一些列的ID,都可以去标示一个用户,接下来我们就看一下如何去做ID Mapping,关于理论我们不多说。

这里有一点要说一下ID Mapping 做完之后我们就会做One ID ,也就是说我们为这些Mapping 上的ID 生成一个新的ID,这个ID 就是One ID,也就是说当我们的One ID 生成之后我们就可以使用这个ID 来打通所有的业务系统,关于One ID 可以参考下一篇文章。

ID Mapping 的难点

  1. 各个平台和各个设备ID 无法直接关联,所以要想关联需要找到关联对象,用SQL 举例就是如果你要想把 A 和 C关联起来,你必须找到可以同时和它们可以关联起来的B,而我们的用户ID 非常多,所以要想关联起来你不止要梳理清楚关联关系,而且你还得写大量的关联代码
  2. 时间问题,有些数据可能属于同一个人,但在某个阶段上,这些数据之间没有任何联系,那么这人的数据可能会被打上两个不同的标识,也就是说你需要在某一刻同时获得这些信息,但是这又是非常困难的。

图计算实现 ID Mapping

图计算(Graph Computing)在金融

数仓建模—ID Mapping(下)相关推荐

  1. 大数据数仓建模(3)

    大数据数仓建模(3) 2.2.6 人员配置参考 1.旁敲侧击的问你到底做过没有 2.你们大概规模,数据量 1整体架构 属于研发部/技术部/数据部/基础平台部,我们属于大数据组,其他还有后端项目组,前端 ...

  2. 浅谈数仓建模及其方法论

    认识数据仓库 1.数仓的定义: 2.数据仓库和数据库的区别: 数仓的发展 1.简单报表阶段:这个阶段,系统的主要目标是解决一些日常的工作中业务人员需要的报表,以及生成一些简单的能够帮助领导进行决策所需 ...

  3. 数仓建模(维度建模)

    目录 一.什么是建模?(为什么建模) 二.模型的好处 三.建模的方法 四.维度建模 4.1 基本概念 4.2 为啥选择维度建模(优缺点) 4.2.1 优点 4.2.2 缺点 4.3 维度建模-星型模型 ...

  4. (转载)通俗易懂数仓建模—Inmon范式建模与Kimball维度建模

    在数据仓库领域,有两位大师,一位是"数据仓库"之父 Bill Inmon,一位是数据仓库权威专家 Ralph Kimball,两位大师每人都有一本经典著作,Inmon大师著作< ...

  5. 数仓建模—分层建设理论(03)

    文章目录 分层建设理论 分层的意义 清晰数据结构体系 数据血缘追踪 减少重复开发和资源浪费 复杂问题简单化 统一数据口径 提高数据质量 关于分层的一点思考 数仓的分层 ods 操作数据层 设计原则 D ...

  6. 离线数仓(三)数仓建模基本理论

    1.建模目标 数据模型就是数据组织和存储方法,它强调从业务.数据存取和使用角度合理存储数据.Linux的创始人Torvalds有一段关于"什么才是优秀程序员"的话:"烂程 ...

  7. 数仓建模—增量数据处理

    增量数据处理 这一节我们不讲技术,讲一个故事,关于数据同步这一块的落地方案可以参考我们之前的文章 数仓建模-数据集成 数仓建模-数据同步方案设计 数仓建模-美团DB数据同步到数据仓库的架构与实践 因为 ...

  8. 数据仓库(3)数仓建模之星型模型与维度建模

      维度建模是一种将数据结构化的逻辑设计方法,也是一种广泛应用的数仓建模方式,它将客观世界划分为度量和上下文.度量是常常是以数值形式出现,事实周围有上下文包围着,这种上下文被直观地分成独立的逻辑块,称 ...

  9. 数仓建模—数仓架构发展史(02)

    发展史 时代的变迁,生死的轮回,历史长河滔滔,没有什么是永恒的,只有变化才是不变的,技术亦是如此,当你选择互联网的那一刻,你就相当于乘坐了一个滚滚向前的时代列车,开往未知的方向,不论什么样的技术架构只 ...

  10. 数仓 建模思想之星型模型、雪花模型、星座模型

    数仓 建模思想之星型模型.雪花模型.星座模型 1. 背景 在大数据开发中,数据一般是分为事实表,维度表,实体表等表. 事实表顾名思义就是记录实际发生的事情如订单表,优惠券使用表等等. 维度表,顾名思义 ...

最新文章

  1. 驱动华为_再补齐一个短板,华为正式宣布进军屏幕驱动行业
  2. ACM公选课第五节贪心4.14-5.4补+第六节上贪心线段覆盖
  3. 解决UnicodeDecodeError: ‘ascii’ codec can’t decode byte 0xe5 in position 108: ordinal not in range(12
  4. android获取控件宽度高度
  5. 进程与线程的区别(面试题)
  6. 《天天数学》连载04:一月四日
  7. 成都信息工程大学c语言题库,成都信息工程学院C语言考试题及答案.docx
  8. 昨天晚上的总结--人跟人的区别在于想的多少吧
  9. 简单的BBcode parsing
  10. 标题利用pwdump、lc7、hashcat工具破解用户口令(基于win7环境下)
  11. voip 软电话 客户端实例 SIP
  12. 常见的四种计量标识及其含义(CNAS / ILAC / CMC / CMA)
  13. 每日一题——孪生素数对(教你如何高效判断素数,判断素数的全部方法)
  14. 【网络编程】一、如何记住OSI七层协议模型,看完还记不住的来打我。
  15. 论文浏览(27) Long-Term Feature Banks for Detailed Video Understanding
  16. 社交平台上的“引流”黑色产业链:“假聊”获粉,精准割韭菜
  17. 企业营销培训讲座在线观看目录
  18. cocos2dx以前的一些文章的项目下载地址
  19. 怎样在cmd(命令提示符)下快速进行复制粘贴操作
  20. IDEA运行报Command line is too long错误解决办法

热门文章

  1. python怎么算二元一次方程_Python简单实现二元一次方程求根
  2. poi导出excel时设置单元格为数字类型(解决:导出Excel时为文本类型选中一整列不能求和问题)
  3. 疑犯追踪第一季/全集Person Of Interest迅雷下载
  4. dialog的各类显示方法
  5. love2d引擎开发资源合集
  6. nali工具解析ip来源
  7. 高瓴张磊:从学渣到投资大佬,也曾多次犯错
  8. 豆瓣top250html源码,用23行代码爬取豆瓣音乐top250
  9. 2022年编程语言排名,官方数据来了,让人大开眼界。
  10. 突发奇想:用单片机开发一款最纯粹的智能水杯方案