一份物流企业实时数仓解决方案
传统的物流数据方案存在各种不足的问题,究其原因是企业自身系统间搭建的数据仓库是离线处理的(T+1),延迟的时效以天计算;数据统计的结果一般仅作为分析使用;在数据决策方面,是被动地等待人为决策,无法做到实时预警、实时决策。
1、实时数仓最佳实践方法论
针对以上情况,跑象对支撑物流业务的数据仓库进行全面升级,通过第三代实时数据平台flashflow 将物流企业实时数仓建设的最佳实践融入到平台使用过程中,此外,flashflow 支持团队已经为多家物流企业数据开发人员持续提供了实时数仓最佳实践方法论。
基于实时数据平台 flashflow 搭建的实时数仓,即使在物流订单量激增的情况下,同样能够做到实时监控所有订单、仓库的物流和作业情况。此外,实时数仓搭建成本降低70%,时效性提升100%,真正做到降本增效。
2、基于 flashflow 搭建实时数仓
物流企业的实时数仓须具备两个重要特性:实时性,稳定性。普通的数据仓库很难满足稳定性需求,flashflow 是一款云原生全链路实时数据平台,支持实时数据采集、流批一体数据处理、实时数据服务等多种数据作业,另外还能够支持开发、调试、发布、运维、诊断、治理等数据作业全生命周期管理,低代码、实时化、易扩展、易整合、领域驱动、全面满足物流企业实时数仓实时性与稳定性需求。
3、实时数仓搭建路径
把 Binlog 数据同步到 kafka,然后使用 flink 从 kafka中消费数据,并把计算结果存储在flashflow中,在访问频率高且数据量大的数据,比如待揽收单量、入库单量、待完成单量等情况下时效性很高。flashflow 进行数据分层处理,ODS层用于存放和加载原始日志、数据,以增量的方式从物流业务系统导入到ODS层;DWD层为数据明细层,对ODS层数据进行清洗;DWS为汇总层,主要存放宽表。
采用 flashflow 流批一体与即席计算查询模式,运用HBase、ClickHouse、Druid等作为实时查询数据库,在flashflow 中多表连接查询能够发挥其最大的作用,采用 flink进行任务实时调度,通过系统界面配置源数据库、目标库、源表、目标表,保存并发布后,即可创建实时数据采集作业,时效可达秒级,充分满足物流企业复杂的业务需求。
flashflow 实时数据平台
flashflow 是支持实时从数据源存储到数据目标存储及数据服务的全链路大数据开发、运维和管理的平台,帮助物流企业从实际需求出发,快速搭建起实时数仓的同时,还能帮助企业解决了大数据应用的痛点问题。
(1)流批一体的实时能力
满足物流企业的实时数仓需求,支持百亿级表与亿级表之间的JOIN,秒级甚至是毫秒级查询响应,同时还支持实时写入、批量数据超高导入性能。例如,实时数据从Binlog解析到ODS层,同时作业任务将分钟级别的统计数据计算到DWS宽表,同时跟离线的数据进行插入更新,就可以得到实时的全量数据表,采取 flink 进行分钟级调度;
(2)平台采用分布式存储(Hbase等)
灵活支持单独扩展计算或者存储,响应快速扩缩容,满足物流业务的动态需求,还支持异构数据源交互分析以及离线数据和实时数据的联动查询。例如,DWD是对ODS层过滤的视图,DWS层是DWD层聚合层的宽表,当查询DWS层时需要将所有表重新查询。但 flashflow 可以轻松做到实时响应,实现毫秒级查询,节省系统调度资源,全面提升了查询的灵活性;
(3)flashflow与Data Mesh思想进行融合
一方面为物流业务自助数据需求响应能力提供了工具引擎;另一方面,也将人月级数据项目开发周期缩短至人日级,大大为物流企业节省投入成本与时间成本,从而让业务在市场变化中主动占领先机;
(4)收获实时的物流数据分析体系成果
实时数仓落地采用 datart+flashflow,整合相关物流系统的运输数据,将物流企业不同系统、不同数据库中进行数据整合,通过实时报表,实时大屏和构建仪表板进行统一数据可视化展现。
物流企业构建起强大的实时数仓有助于消除供应链效率低下,改善需求与供应的匹配度以及提高整个物流管理系统的可见性和连通性,将以前的手动流程转为自动化、实时化、智能化流程。
实时数仓让企业实现实时的揽收、库内可视化操作、中转调拨等实时报表、实时大屏,对物流业务运营提供了非常强有力的实时数据支撑,整体时效较此前大幅提升,也给用户带来更好的物流体验,最大程度地发挥其数据价值。
一份物流企业实时数仓解决方案相关推荐
- 亚马逊云科技Serverless构建的实时数仓解决方案,助力猎豹降低30%成本
也许你也听过这样一句话:"21世纪什么最贵?人才!"当数字经济全面席卷而来,这个问题的答案不可置否地变为了"数据".通过数据分析获取近乎实时的洞察,以驱动业务的 ...
- 实时数仓入门训练营:实时数仓助力互联网实时决策和精准营销
简介:<实时数仓入门训练营>由阿里云研究员王峰.阿里云高级产品专家刘一鸣等实时计算 Flink 版和 Hologres 的多名技术/产品一线专家齐上阵,合力搭建此次训练营的课程体系,精心打 ...
- 当 TiDB 与 Flink 相结合:高效、易用的实时数仓
简介:利用实时数仓,企业可以实现实时 OLAP 分析.实时数据看板.实时业务监控.实时数据接口服务等用途.但想到实时数仓,很多人的第一印象就是架构复杂,难以操作与维护.而得益于新版 Flink 对 S ...
- ULTRON — 360基于Flink的实时数仓平台
前言:ULTRON项目从去年开始立项,伴随着Flink社区的成熟不断迭代.在开发过程中,面临着许多困难,一方面是人手紧张,另一方面是需要打通和实现的功能点复杂,从底层K8S/YARN到FLINK核心的 ...
- 实时数仓+知识图谱综合解决方案-首款图数仓AbutionGraph的行业落地报告PPT
AbutionGraph是北京图特摩斯科技研发的一款物联网级的大数据通用图数据库,使知识图谱技术不仅仅局限与关联关系存储的场景,我们可以把其应用到金融风控.车联网.智慧城市(传感器采集监控)等等要求高 ...
- 菜鸟实时数仓2.0进阶之路
导读:供应链物流场景下的业务复杂度高,业务链路长,节点多,实体多,实时数仓建设难度高.菜鸟跨境进口业务场景更是如此,更复杂的场景带来更复杂的实体数据模型,对接的业务系统多导致ETL流程特别复杂,还有海 ...
- 阿里巴巴电商搜索推荐实时数仓演进之路
分享嘉宾:张照亮 阿里巴巴 高级技术专家 编辑整理:郑银秋 出品平台:DataFunTalk 导读:今天分享的内容是阿里搜索推荐数据平台研发团队在实时数仓的一些探索,围绕着团队在数仓上基于Flink ...
- 滴滴基于 Flink 的实时数仓建设实践
简介:随着滴滴业务的高速发展,业务对于数据时效性的需求越来越高,而伴随着实时技术的不断发展和成熟,滴滴也对实时建设做了大量的尝试和实践.本文主要以顺风车这个业务为引子,从引擎侧.平台侧和业务侧各个不同 ...
- 揭秘!阿里实时数仓分布式事务Scale Out设计
简介: Hybrid Transaction Analytical Processing(HTAP) 是著名信息技术咨询与分析公司Gartner在2014年提出的一个新的数据库系统定义,特指一类兼具O ...
最新文章
- 计算机控制里ddc什么缩略语,空调自动化术语和缩略语.doc
- 各种的jsp数据库连接方法代码!(以前收集的)
- RCNN (Regions with CNN) 目标物检测 Fast RCNN的基础
- learning scala read from file
- String中的“equal方法”和“==”
- python能解密java的_实现Java加密,Python解密的RSA非对称加密算法功能
- 屏蔽朋友圈的第一天的感悟
- 编写好代码的10条戒律
- ROS实现两台计算机之间的网络通信
- jQuery Mobile中按钮<a>或<button>添加class样式ui-btn-*
- python修改表格居中_python修改表格居中_CSS样式更改——列表、表格和轮廓
- pnp mysql_NPN和PNP三极管的区别
- 《缠中说禅108课》6:本 ID 如何在五粮液、包钢权证上提款的
- JavaScript 案例综合提升
- 【面试】Tomcat面试题
- 云学堂2.0绘制教育桌面云新图谱
- aws mysql 多区_Amazon RDS 多可用区部署
- ALPS TCP新建配置——网络测试仪实操
- 解决listview 嵌套listview
- Vite 4.0 正式发布!