本文为作者投稿,作者简介:诸葛子房,曾供职于京东,现就职于BAT,在大数据领域有多年实践经验

一、背景:

从2004年开始,京东进军互联网线上化开始到至今,随着京东的高速发展,京东商城的订单量从万级到百万级、最终到达亿级。而对于实时的数据需求也是层出不穷,实时计算架构随着数据量的增长,不断进行革新。

(1)订单量万级、百万级(以京东海外站为例) 在订单量万级、百万级别的时候,也存在不少实时的数据需求,比如:商家需要看看自己每天的成交量、老板需要看看整体的成交金额,以为后续的融资做准备。类似于现在很多的a、b轮创业公司数据体量。

解决方案:而此时为了节省更少的资源,减少更少花销。在实时架构设计上就需要尽量用更少的成本来解决这种问题。基于mysql的实时数据统计方案就比较适合了。

步骤:将线上业务系统数据实时同步到大数据中心(在mysql的基础上搭建了一套大数据架构),避免了Hadoop生态庞大复杂的体系。基于mysql数据宽表进行数据统计,将统计结果写到mysql指标结果表中,输出一些报表或者服务。详细步骤见下图。

架构优缺点:
(1)开发简单,基于mysql,同时避免hadoop生态复杂的体系,节省开销。
(2)数据量过大,查询和聚合性能较差,mysql单表量级在百万级别。
(3)在此架构中需要对mysql及其熟练,如何设计索引,如何进行查询统计优化。

(2)订单量亿级(以京东主站为例)
随着公司的发展,数据体量的增大,达到千万甚至亿级别时,基于mysql的数据统计方案已经完全没办法满足统计需求了,mysql查询也查不动了。基于此产生了一套新的技术方案:flink接kafka消息数据,直接进行指标计算,写入到redis里面,最后提供最外提供服务。详细步骤见下图。
架构优缺点:
(1)能够支撑亿级数据量的统计需求,对于大数据量友好
(2)时效性高,计算延迟较低
(3)技术方案相对复杂,新增指标需要重新开发,上线任务。

(3)订单量亿级(以京东主站为例)
上述基于flink 直接指标计算的方案,优点非常明显,缺点也非常明显,如果新增指标,需要重新开发上线,对于频繁的业务需求变更,已经很难满足了,因此产生了基于OLAP的技术方案。Flink接kafka 消息,将明细数据写入到OLAP引擎(clickhouse、apache doris)当中,构建一张宽表,然后直接进行数据查询统计基于OLAP引擎,对于新增指标只需要新增不同的sql查询语句就能解决需求,而不用重新开发,提高了整体效率,能够应对业务的频繁变更。详细步骤见下图。
架构优缺点:
(1)能够支撑亿级数据量的统计需求,对于大数据量友好
(2)时效性较高
(3)开发简单,能够快速应对业务需求。

三、总结

随着公司高速发展,数据体量的改变对于技术的选型也是不断进行变更的。只有了解不同的技术架构的优缺点,在合适的阶段选择不同的数据架构,才能够更好的服务于业务。同时根据自己所处的公司当前的发展状况,预估公司后续的发展,在技术架构选型上也是有前瞻性的。

来源:https://blog.csdn.net/weixin_43291055/article/details/105125418

相关阅读:

日均20万亿次计算量!腾讯基于Flink的实时流计算平台演进之路

实战 | Kafka + Flink + Redis 的电商大屏实时计算案

基于 Flink 实现的商品实时推荐系统(附源码)

一文带你全方位(架构,原理及代码实现)了解Flink(3.2W字建议收藏)

基于 Flink + ClickHouse 打造轻量级点击流实时数仓

Hudi on Flink在顺丰的实践应用.ppt

基于Flink构建实时数据仓库.ppt

京东实时计算架构演进之路相关推荐

  1. 实时数仓 | 京东计算架构演进之路

    一.背景: 从2004年开始,京东进军互联网线上化开始到至今,随着京东的高速发展,京东商城的订单量从万级到百万级.最终到达亿级.而对于实时的数据需求也是层出不穷,实时数仓.实时计算架构随着数据量的增长 ...

  2. 马蜂窝实时计算平台演进之路

    MES 是马蜂窝统一实时计算平台,为各条业务线提供稳定.高效的实时数据计算和查询服务.在整体设计方面,MES 借鉴了 Lambda 架构的思想.本篇文章,我们将从四个方面了解 MES: 1. 关于 L ...

  3. clickhouse hbase性能对比_QQ音乐PB级ClickHouse实时数据平台架构演进之路

    OLAP(On-Line Analytical Processing),是数据仓库系统的主要应用形式,帮助分析人员多角度分析数据,挖掘数据价值.本文基于QQ音乐海量大数据实时分析场景,通过QQ音乐与腾 ...

  4. QQ音乐PB级ClickHouse实时数据平台架构演进之路

    导语 | OLAP(On-Line Analytical Processing),是数据仓库系统的主要应用形式,帮助分析人员多角度分析数据,挖掘数据价值.本文基于QQ音乐海量大数据实时分析场景,通过Q ...

  5. 今日头条架构演进之路——高压下的架构演进专题(含PPT)

    今日头条架构演进之路--高压下的架构演进专题(含PPT) 原创 2016-07-06 夏绪宏 高可用架构 导读:高可用架构在 6 月 25 日举办了『高压下的架构演进』专题沙龙,进行了闭门私董会研讨及 ...

  6. 交易系统架构演进之路(二):2.0版

    欢迎关注「Keegan小钢」公众号获取更多文章 交易系统架构演进之路(一):1.0版 回顾 1.0 版 我们来回顾下 1.0 版 的内容,需求上经过分析,最终 1.0 版只是做一个 MVP--最小可行 ...

  7. [2016.10.17日更新]各大互联网公司架构演进之路汇总

    大型网站架构演化历程 大型网站架构技术一览 Web 支付宝和蚂蚁花呗的技术架构及实践 支付宝的高可用与容灾架构演进 聚划算架构演进和系统优化 (视频+PPT) 淘宝交易系统演进之路 (专访) 淘宝数据 ...

  8. 各大互联网公司架构演进之路汇总

    大型网站架构演化历程 大型网站架构技术一览 Web 支付宝和蚂蚁花呗的技术架构及实践 聚划算架构演进和系统优化 (视频+PPT) 淘宝交易系统演进之路 (专访) 淘宝数据魔方技术架构解析 淘宝技术发展 ...

  9. [10.17日更新]各大互联网公司架构演进之路汇总

    一篇不错的大型网站架构文章及视频汇总资料, 文章出处:http://www.hollischuang.com/archives/1036 大型网站架构演化历程 大型网站架构技术一览 Web 支付宝和蚂 ...

最新文章

  1. Go 学习笔记(6)— 变量定义、变量声明、变量作用域
  2. PHP+redis实现超迷你全文检索
  3. 1072 Gas Station (30 分)【难度: 中 / 知识点: Dijkstra + 枚举】
  4. GPLinker:基于GlobalPointer的事件联合抽取
  5. 这届毕业生薪资高,是真的
  6. 管理实践-教练技术的应用
  7. SpringBoot通过yml和xml文件配置日志输出
  8. (计算机组成原理)第五章中央处理器-第四节4:微程序控制单元设计
  9. admin客户管理系统html5模板
  10. 基于vue2.0 + elementUI 后台管理平台
  11. HTML min/maxlength
  12. Java包装器类及自动装箱(自动打包)
  13. SSH框架下的在线人数统计的一种解决途径
  14. android google 下拉刷新 csdn,使用google自带包实现下拉刷新功能
  15. VUE3中使用粒子特效
  16. 六一儿童节,程序员写给女儿的一封信
  17. PHP编程学习之路 2
  18. IIS6 日志删除脚本(t00ls)
  19. C++图书管理系统_艾孜尔江撰
  20. iOS 堆栈获取异常分析

热门文章

  1. 迅雷“回归”引发的IOS上架痛点思考
  2. 六、注册页功能制作《仿淘票票系统前后端完全制作(除支付外)》
  3. 深度剖析E680G应用五.Telnet与主题
  4. 聊天机器人-意图识别类,开源库推荐
  5. Java人员该如何站稳脚跟 需要具备哪些技能
  6. 【开源硬件篇】STM32F103C8T6核心板
  7. mysql实验四数据库查询和视图_数据库-第四次实验报告-视图-t-sql语句
  8. 程序员的专属微信公众号编辑器:定制 Markdown 转 HTML
  9. 用计算机弹出黎明的黑暗,黎明杀机easyanticheat error怎么解决 跳出easyanticheat error怎么办按...
  10. 图片转base64跨域问题