数仓:爱奇艺数仓平台建设实践
文章目录
- 简介
- 一、数据仓库 1.0
- 二、数据仓库 2.0
- 三、数仓建设
- 3.1 一致性维度
- 3.2 指标体系
- 3.3 建模流程
- 3.4 数据图谱
- 3.5 数据血缘
- 总结
简介
先介绍一下爱奇艺公司整体的业务情况以及数据仓库 1.0 的设计和出现的问题,针对数仓 1.0 的缺陷,是如何演进到数仓 2.0 架构以及数仓 2.0 需要解决的问题和需要达成的目标。
这张图非常清晰的展示了爱奇艺的产品矩阵,早期爱奇艺是视频业务,后来从视频业务周边衍生出来一些新的业务,以视频业务为主围绕着核心 IP,衍生出短视频、小视频、奇巴布、爱奇艺阅读、叭哒、泡泡、奇秀直播、爱奇艺知识、体育、电商等众多业务,从苹果树到苹果园构建了泛娱乐生态矩阵。
可以看到产品矩阵中涉及的业务很多,每个业务都会产生自己的数据,同时也有着自己独特的产品形态。既要满足在某个特定业务场景下进行面向
数仓:爱奇艺数仓平台建设实践相关推荐
- 基于Apache Flink的爱奇艺实时计算平台建设实践
导读:随着大数据的快速发展,行业大数据服务越来越重要.同时,对大数据实时计算的要求也越来越高.今天会和大家分享下爱奇艺基于Apache Flink的实时计算平台建设实践. 今天的介绍会围绕下面三点展开 ...
- Flink从入门到精通100篇(二十三)-基于Apache Flink的爱奇艺实时计算平台建设实践
前言 随着大数据的快速发展,行业大数据服务越来越重要.同时,对大数据实时计算的要求也越来越高.今天会和大家分享下爱奇艺基于Apache Flink的实时计算平台建设实践. 今天的介绍会围绕下面三点展开 ...
- 爱奇艺数据中台的建设实践
导读:随着市场对数据价值的认可,促进了数据在各行各业的爆发式增长,以及大数据设施的快速演化,同时也带来了不少新的数据问题:解决这些问题,发挥更大的数据价值,成为了各大公司的重点工作.爱奇艺通过数据中台 ...
- 爱奇艺大数据分析平台的演进之路
首先讲一下爱奇艺大数据平台业务背景,目前日均DAU接近三亿,爱奇艺在业务初期主要关注于长视频,随后发展业务有PPC.UPC,同时还发展了游戏.直播.小说等业务.目前业务线达到20多条,存量的设备信息达 ...
- kylin如何支持flink_日均万亿条数据如何处理?爱奇艺实时计算平台这样做
1.爱奇艺 Flink 服务现状 爱奇艺从 2012 年开始开展大数据业务,一开始只有二十几个节点,主要是 MapReduce.Hive 等离线计算任务.到 2014 年左右上线了 Storm.Spa ...
- 日均万亿条数据如何处理?爱奇艺实时计算平台这样做
摘要:本文由爱奇艺大数据服务负责人梁建煌分享,介绍爱奇艺如何基于 Apache Flink 技术打造实时计算平台,并通过业务应用案例分享帮助用户了解 Apache Flink 的技术特点及应用场景.提 ...
- 爱奇艺基础数据平台演进
爱奇艺基础数据平台主要是为了统一公司内部的基础数据交换规范,解决不同团队之间ID不统一问题(各团队都有自己独立的ID).数据定义不统一.数据更新不及时等问题. 随着公司业务发展,除了视频基础数据,还逐 ...
- 爱奇艺埋点投递治理实践
9月26日下午,爱奇艺技术产品团队举办了第19期"i技术会",本次技术会的主题是"数据治理探索与应用",来自快手.美团.快看的几位资深专家同大家就相关议题进行了 ...
- TiDB 在爱奇艺实时分析场景的应用实践
作者:luzizhuo 原文来源: https://tidb.net/blog/21ab5c22 本文根据路希在[PingCAP DevCon 2021]上的演讲整理而成. 视频回顾: https:/ ...
- i技术会 | 爱奇艺效果广告探索与实践
今天分享的主要内容分为以下四块内容:爱奇艺效果广告产品介绍,主要是介绍爱奇艺效果广告的主要资源位以及对应的售卖形式:二是效果广告排序算法实践介绍,这里主要介绍在排序算法过程中使用的精排模型和粗排模型: ...
最新文章
- Do a test write by windows live writer
- group by很多字段是不是会很慢_面试官:数据量很大,分页查询很慢,有什么优化方案?...
- Shell-11--for
- Hbase(1)——基础语句(1)
- 在Linux中su和sudo区别,Linux中su和sudo的用法和区别
- 博士面试被拒,只因第一学历非985、211...
- 红安一中高考2021成绩查询,红安一中2019高考喜报成绩、一本二本上线人数情况...
- python字符串反向输出_Python反向字符串– 5种方法和最佳方法
- 推荐一个插件: The Great Suspender,大大减少chrome浏览器内存占用量
- 联想小新air13装双系统_联想小新 Air 13IBK Pro 安装黑苹果Windows双系统教程
- matlab曲线导入cad,MATLAB导入CAD数据
- android exoplayer 直播流,android – Exoplayer自适应hls流媒体
- NOI题库练习1.4(08)
- 【3ds Max】 - 如何使用分布式渲染?
- win10 系统无法远程桌面连接到服务器,Win10系统不能建立远程桌面连接总是连接不上如何解决...
- vue中处理文本不换行问题
- 算法很没:快速渡河问题
- 猎头Fiona总结的加入淘宝网的十个理由
- oracle数据库连接非常慢,sqlplus很快,用客户端就很慢,十几秒才好
- 学习win32汇编指令:lea和offset