文章目录

  • 简介
  • 一、数据仓库 1.0
  • 二、数据仓库 2.0
  • 三、数仓建设
    • 3.1 一致性维度
    • 3.2 指标体系
    • 3.3 建模流程
    • 3.4 数据图谱
    • 3.5 数据血缘
  • 总结

简介

先介绍一下爱奇艺公司整体的业务情况以及数据仓库 1.0 的设计和出现的问题,针对数仓 1.0 的缺陷,是如何演进到数仓 2.0 架构以及数仓 2.0 需要解决的问题和需要达成的目标。

这张图非常清晰的展示了爱奇艺的产品矩阵,早期爱奇艺是视频业务,后来从视频业务周边衍生出来一些新的业务,以视频业务为主围绕着核心 IP,衍生出短视频、小视频、奇巴布、爱奇艺阅读、叭哒、泡泡、奇秀直播、爱奇艺知识、体育、电商等众多业务,从苹果树到苹果园构建了泛娱乐生态矩阵。

可以看到产品矩阵中涉及的业务很多,每个业务都会产生自己的数据,同时也有着自己独特的产品形态。既要满足在某个特定业务场景下进行面向

数仓:爱奇艺数仓平台建设实践相关推荐

  1. 基于Apache Flink的爱奇艺实时计算平台建设实践

    导读:随着大数据的快速发展,行业大数据服务越来越重要.同时,对大数据实时计算的要求也越来越高.今天会和大家分享下爱奇艺基于Apache Flink的实时计算平台建设实践. 今天的介绍会围绕下面三点展开 ...

  2. Flink从入门到精通100篇(二十三)-基于Apache Flink的爱奇艺实时计算平台建设实践

    前言 随着大数据的快速发展,行业大数据服务越来越重要.同时,对大数据实时计算的要求也越来越高.今天会和大家分享下爱奇艺基于Apache Flink的实时计算平台建设实践. 今天的介绍会围绕下面三点展开 ...

  3. 爱奇艺数据中台的建设实践

    导读:随着市场对数据价值的认可,促进了数据在各行各业的爆发式增长,以及大数据设施的快速演化,同时也带来了不少新的数据问题:解决这些问题,发挥更大的数据价值,成为了各大公司的重点工作.爱奇艺通过数据中台 ...

  4. 爱奇艺大数据分析平台的演进之路

    首先讲一下爱奇艺大数据平台业务背景,目前日均DAU接近三亿,爱奇艺在业务初期主要关注于长视频,随后发展业务有PPC.UPC,同时还发展了游戏.直播.小说等业务.目前业务线达到20多条,存量的设备信息达 ...

  5. kylin如何支持flink_日均万亿条数据如何处理?爱奇艺实时计算平台这样做

    1.爱奇艺 Flink 服务现状 爱奇艺从 2012 年开始开展大数据业务,一开始只有二十几个节点,主要是 MapReduce.Hive 等离线计算任务.到 2014 年左右上线了 Storm.Spa ...

  6. 日均万亿条数据如何处理?爱奇艺实时计算平台这样做

    摘要:本文由爱奇艺大数据服务负责人梁建煌分享,介绍爱奇艺如何基于 Apache Flink 技术打造实时计算平台,并通过业务应用案例分享帮助用户了解 Apache Flink 的技术特点及应用场景.提 ...

  7. 爱奇艺基础数据平台演进

    爱奇艺基础数据平台主要是为了统一公司内部的基础数据交换规范,解决不同团队之间ID不统一问题(各团队都有自己独立的ID).数据定义不统一.数据更新不及时等问题. 随着公司业务发展,除了视频基础数据,还逐 ...

  8. 爱奇艺埋点投递治理实践

    9月26日下午,爱奇艺技术产品团队举办了第19期"i技术会",本次技术会的主题是"数据治理探索与应用",来自快手.美团.快看的几位资深专家同大家就相关议题进行了 ...

  9. TiDB 在爱奇艺实时分析场景的应用实践

    作者:luzizhuo 原文来源: https://tidb.net/blog/21ab5c22 本文根据路希在[PingCAP DevCon 2021]上的演讲整理而成. 视频回顾: https:/ ...

  10. i技术会 | 爱奇艺效果广告探索与实践

    今天分享的主要内容分为以下四块内容:爱奇艺效果广告产品介绍,主要是介绍爱奇艺效果广告的主要资源位以及对应的售卖形式:二是效果广告排序算法实践介绍,这里主要介绍在排序算法过程中使用的精排模型和粗排模型: ...

最新文章

  1. Do a test write by windows live writer
  2. group by很多字段是不是会很慢_面试官:数据量很大,分页查询很慢,有什么优化方案?...
  3. Shell-11--for
  4. Hbase(1)——基础语句(1)
  5. 在Linux中su和sudo区别,Linux中su和sudo的用法和区别
  6. 博士面试被拒,只因第一学历非985、211...
  7. 红安一中高考2021成绩查询,红安一中2019高考喜报成绩、一本二本上线人数情况...
  8. python字符串反向输出_Python反向字符串– 5种方法和最佳方法
  9. 推荐一个插件: The Great Suspender,大大减少chrome浏览器内存占用量
  10. 联想小新air13装双系统_联想小新 Air 13IBK Pro 安装黑苹果Windows双系统教程
  11. matlab曲线导入cad,MATLAB导入CAD数据
  12. android exoplayer 直播流,android – Exoplayer自适应hls流媒体
  13. NOI题库练习1.4(08)
  14. 【3ds Max】 - 如何使用分布式渲染?
  15. win10 系统无法远程桌面连接到服务器,Win10系统不能建立远程桌面连接总是连接不上如何解决...
  16. vue中处理文本不换行问题
  17. 算法很没:快速渡河问题
  18. 猎头Fiona总结的加入淘宝网的十个理由
  19. oracle数据库连接非常慢,sqlplus很快,用客户端就很慢,十几秒才好
  20. 学习win32汇编指令:lea和offset

热门文章

  1. 【基本操作】交换机VLAN的配置
  2. 关于html各个功能的简单事例
  3. linux centos分2t以上,centos支持2T以上分区方法
  4. 数据结构 || 二维数组按行存储和按列存储
  5. 淘宝之外,最火爆的十个购物网站
  6. 编程语言习题集(2)
  7. oracle数据库函数mod,oracle数据库常用函数
  8. CentOS6.5系统光纤连接存储的多路径配置及使用方法
  9. C语言数据结构_图、图的深度优先遍历、广度优先遍历
  10. 数据结构学习——表、查找