在刚刚结束的“2019智能决策峰会”上,观远数据重磅发布了观远智能分析平台2.0版本。高性能实时数据引擎作为备受瞩目的功能,得到了大家的广泛认可。下面就让我们一起来了解下基于Lambda架构的观远实时数据解决方案。

BI与实时数据

随着商业领域中的业务场景越来越复杂,更实时、更大量的数据正在被不断生产出来,如何将这些实时的海量数据高效的进行处理就变成了一个挑战。一般而言,传统BI只能支持T+1天时效延迟的数据决策,数据处理过程以ETL为主,实时数据处理存在天然缺陷;但新一代BI增加了更多样化数据源的导入存储,支持了更灵活的数据处理方式与更敏捷的数据处理时效,在合理规划服务器计算资源的前提下,新一代BI可以支持准实时、甚至分钟级实时数据的更新展示。可见,数据实时化已成为新一代BI的显著优势。

Lambda架构

作为新一代BI的典型代表,观远数据基于Lambda架构设计了一套高性能的实时数据引擎,那么什么是Lambda架构呢?

Lambda架构是一套通用的的实时大数据处理框架,其作者Nathan Marz基于对数据和查询的本质认识,整合了离线计算与实时计算,融合了不可变性、读写分离和复杂性隔离等一系列架构原则,从而设计出能满足实时大数据系统关键特性(如高容错、低延时、可扩展等)的Lambda架构。

Lambda架构的核心思想是将大数据处理系统划分为三层:Batch Layer、 Real-Time(Speed) Layer以及Serving Layer,从而将实时任务与批处理任务很好地结合起来,最终实现对大数据的实时处理。

  • Batch Layer:批处理层。该层可以很好的处理离线数据,在数据集上预先聚合好实时查询所需要数据的历史部分,从而得到Batch View。

  • Real-Time(Speed) Layer:加速层。该层可以处理最新的增量数据流,不断将数据以时间维度增量聚合到Real-Time
    View。

  • Serving Layer :服务层。用于响应用户的查询请求,可以合并Batch View和Real-time
    View中的数据到最终的展示结果。

Guandata实时引擎

在观远智能分析平台1.0时代,观远数据可以提供两种准实时数据解决方案,但他们都存在一些不足。

  • 用户在创建直连数据库的数据集时,可选择“支持实时卡片数据”。数据集版本有效时间将会缩小为10分钟,用户基于该数据集进行数据查询展示时,可达到准实时的效果。但这种处理方式对业务库会造成较大压力,且无法实现多源数据融合。

  • Guan-Index类型的数据集可支持最高每天四次的更新频率,按此频率抽取到观远平台上来的数据,通过ETL可以实现与其他数据源的融合。相比于上一种方案,这种方案虽然突破了对于数据来源的限制,但一方面数据更新频率受到限制,另一方面ETL运行也会占掉大量的计算资源从而导致系统性能受到影响。

在观远智能分析平台2.0版本中,观远数据推出了最新一代的实时数据引擎,通过汲取Lambda架构的精髓,将历史数据与实时数据进行分开处理,既能够实现多源数据的融合,又可以支持增量更新且占用较少的计算资源。该方案最终不仅可以进行简单的数据实时更新与展示,还可以支持复杂的计算与分析(比如零售场景中常用的同环比指标以及累计指标的实时运算)。

下面以门店维度的销售指标监控为例,列举了实时数据分析的典型场景:

  • 门店经理通常需要关注当日每时每刻的业务KPI,但他关注的实时指标很有可能分散在不同的数据来源中(比如销售额、客流量);

  • 除了实时销售额以外,门店经理还会关注销售额的实时累计值,用来衡量本周累计完成的营业额是否已经达标,甚至会关心当前门店在整个区域乃至整个公司目前的销售额排名是什么水平,更复杂一点,如果能随时了解当前销售额到与昨天/上周同一时段相比的同环比变化,那就最好了;

  • 当然,门店经理关注的数据并非都是需要实时更新的,还会有一些相对静态的附加信息,例如门店基础信息、门店当天的目标营业额等。

实时数据的展示与融合

在观远实时数据解决方案中,通过多数据源的融合,对于门店经理关注的销售额以及客流量,都可以实现高频次的聚合与实时展示。

实时数据的复杂计算

零售行业中比较关注的累计值、排名、同环比,这些基于实时指标的二次分析与计算,在观远实时数据解决方案中也都可以得到完满的解决。


附加信息的展示

观远实时引擎同样可以通过数据融合的方式将附加信息添加为实时数据集的静态数据来源,从而进一步在可视化时进行展示。

Guandata实时数据引擎突破了观远1.0时代数据更新频率以及运算能力的限制,显著降低了数据从产生到消费的端到端时延,最终完美支持了实时的数据更新响应与极高频次的数据运算。

作为区别于传统BI的一大亮点,观远实时数据解决方案的应用场景还有很多,我们致力于把实时数据对于数据分析的价值发挥到极致。您在使用过程中遇到什么问题、有什么好的想法和建议,也欢迎留言来跟我们沟通探讨!

文章来源:观远数据产品部

产品咨询:shopbi2018

智能分析的所见即所得——基于Lambda架构的实时数据引擎相关推荐

  1. 转载文章:Microsoft 将僵尸网络威胁智能分析程序引入云中以提供近实时数据

    Microsoft 数字犯罪部门打击网络犯罪的首要任务是保护用户.我们深知,清理世界各地感染恶意软件的用户计算机与打破威胁同等重要,因此我们在 2010 年推出了Project MARS (Micro ...

  2. 基于java语言轻量级实时风控引擎

    介绍: radar是一款基于java语言,使用Springboot + Mongodb + Groovy + Es等框架搭建的轻量级实时风控引擎,适用于反欺诈应用场景,极简的配置,真正做到了开箱即用. ...

  3. 芯原助力蓝洋智能部署基于Chiplet架构的芯片产品

    内置芯原GPGPU IP的Chiplet芯片算力可达8 TFLOPS ,内置芯原NPU IP的Chiplet芯片算力可达240 TOPS 2023 年 3 月30日,中国上海--芯原股份(芯原,股票代 ...

  4. 大数据应用实践1:基于开源架构的股票行情分析与预测

    股票市场行情分析与预测一直是数据分析领域里面的重头戏,确切地说IT行业的每一次重大发展的幕后推动者以及新产品(特别是高端产品)的最先尝试者都包含金融行业,特别是证券交易市场,它符合大数据的四大特征:交 ...

  5. 【金猿产品展】观远一站式智能分析平台——数据驱动企业精益增长

    观远数据产品 本产品由观远数据投递并参与"数据猿年度金猿策划活动--2020大数据产业创新服务产品榜单及奖项"评选. 大数据产业创新服务媒体 --聚焦数据 · 改变商业 观远一站式 ...

  6. Lambda架构与推荐在电商网站实践

    王富平  现为1号店搜索与精准化部门架构师,之前在百度从事数据挖掘相关工作,对实时处理有着深刻的研究.一直从事大数据相关研发工作,2013年开发了一款SQL实时处理框架,致力于建设高可用的大数据业务系 ...

  7. 基于Hadoop架构下的FineBI大数据引擎技术原理

    随着各个业务系统的不断增加,以及各业务系统数据量不断激增,业务用户的分析诉求越来越多且变化很快,IT数据支撑方的工作变得越来越复杂. 1.数据来自多个不同的系统,存在需要跨数据源分析,需要对接各种不同 ...

  8. 用于实时大数据处理的Lambda架构

    1.Lambda架构背景介绍 Lambda架构是由Storm的作者Nathan Marz提出的一个实时大数据处理框架.Marz在Twitter工作期间开发了著名的实时大数据处理框架Storm,Lamb ...

  9. 什么是大数据lambda架构

    一.什么是Lambda架构 Lambda架构由Storm 的作者 [Nathan Marz] 提出, 根据维基百科的定义,Lambda 架构的设计是为了在处理大规模数据时,同时发挥流处理和批处理的优势 ...

  10. 使用Business Events和Business Monitor对传感器数据进行智能分析

    张 鹏, 软件工程师, IBM 张鹏,是 IBM 中国开发中心的软件工程师,目前从事 IBM WebSphere Sensor Events 的开发和测试工作,加入 IBM 前从事政府采购软件的相关研 ...

最新文章

  1. 人工智能论坛、AI x Science 论坛和首席智行官大会
  2. C++设计模式(转)
  3. 突然让我想起了以前的面试(转http://blog.163.com/lzy_1920116/blog/)
  4. d-s 多传感器信息融合 matlab实现_自动驾驶中的多传感器融合
  5. oracle linux 配置本地yum,oracle linux配置本地光盘yum源
  6. flask找不到css_Flask干货:访问数据库——Flask-SQLAlchemy初始化
  7. 【持续更新】设计技巧++
  8. Ubuntu 16 apt-get软件包管理错误问题解决记录
  9. 【一天一个C++小知识】011.C++编译的流程
  10. [转]Boost智能指针——scoped_ptr
  11. 机器视觉的四大类应用
  12. 解决更新Win11后没有ie浏览器问题
  13. 小样儿想封我?WebOS 1.2.1再次突破iTunes同步限制
  14. 台式机计算机在哪里看,IT教程:台式电脑主板型号在哪里看
  15. linux系统服务器日志,linux系统日志及日志服务器
  16. 三子棋 C语言【详解】
  17. 【211】win10快捷键大全
  18. html怎么设置毛笔字体,三种实用的毛笔书法字体设计制作教程
  19. 我炒股十五年,亏损超过五十万,我该怎么办?
  20. selenium之浏览器弹出新窗口并在新窗口操作

热门文章

  1. 什么是TPS,什么是QPS
  2. 是时候要说再见了,春风十里,不如邮你!
  3. 程序媛秋招心得及面试经验分享
  4. PKM全民推广系列四:“个人知识管理”的知识分类体系
  5. 产品生命周期管理PLM技术研究
  6. opencv vector matlab,opencv实现 Matlab 寻找峰值函数 findpeaks
  7. 汽车4G车载TBOX智能信息终端
  8. BI工具和报表工具有什么不同
  9. 【机器学习】使用 IQR、Z 分数、LOF 和 DBSCAN 检测异常值
  10. Visio 安装暴雷记录