数据仓库现代化,从使用 Stitch 的批处理 ETL 到使用 Kafka 的流式 ETL

大多数组织的用例简单且标准:提取、转换和加载 (ETL) Salesforce 数据到 Google BigQuery 数据仓库,以便企业可以使用这些数据。但它比听起来更复杂。

组织通常依靠第三方 ETL 工具定期将数据从 CRM 和其他应用程序加载到他们的数据仓库。这些批处理工具在 Salesforce 中捕获业务事件与它们可用于消费和处理之间引入了延迟。批处理工作负载通常会导致 Salesforce 报告和内部仪表板之间存在差异,从而导致对数据完整性和可靠性的担忧。

最初使用的 Talend 的 Stitch 批处理 ETL 工具。旧架构如下所示:

批量 ETL 和中间的 3rd 方工具的后果导致信息更新不足和不一致。

现在将流处理功能构建到内部数据仓库管道中。利用其自己的完全托管的 Confluent Cloud 连接器(在本例中为 Salesforce CDC 源和 BigQuery 接收器连接器)、用于数据治理的 Schema Registry 以及用于可靠流 ETL 的 ksqlDB + Kafka Streams,以将 SFDC 数据发送到 BigQuery。这是现代化的架构:

从本地数据库到多个云原生数据湖

Shippeo 为物流供应商、托运人和承运人提供实时和多式联运的可视性。它的软件使用自动化和人工智能来分享实时见解,实现更好的协作,并释放您供应链的全部潜力。该平台可以即时访问每次交付的预测性实时信息。

Shippeo 描述了他们如何将传统数据库(MySQL和PostgreSQL)和云原生数据仓库(Snowflake和BigQuery)与Apache Kafka和Debezium集成。

这是利用“同类最佳”方法进行数据仓库和分析的云原生企业架构的一个很好的例子。Kafka 将分析工作负载与事务系统分离,并为慢速消费者处理背压。

Sykes Cottages:采用 Confluent Cloud、Kafka Connect、Snowflake 的完全托管的端到端管道

Sykes Holiday Cottages 是英国领先且发展最快的独立度假别墅租赁机构之一,代表英国、爱尔兰和新西兰的 19,000 多间别墅。

客户在网络上的体验是重中之重,也是保持竞争力的一种方式。目标是为客户提供完美的度假小屋体验,并在沿途的每个阶段享受乐趣。获得数据管道来推动这项创新至关重要。数据仓库现代化和数据流支持通过数据驱动的方法进一步创新 Web 体验的新方法。

DoorDash:从多管道到雪花集成的数据流

即使是数字原住民——他们在云中开始他们的业务,他们自己的数据中心没有遗留应用程序——也需要对企业架构进行现代化改造,以改进业务流程、降低成本并为其下游应用程序提供实时信息。

构建多个试图实现类似目的的管道是成本低效的。DoorDash 使用 Amazon SQS 和 Amazon Kinesis 等云原生 AWS 消息传递和流系统将数据摄取到 Snowflake 数据仓库中:

用于数据仓库现代化的云原生数据流的案例相关推荐

  1. 他山之石可以攻玉, 不可不读的阿里云原生中间件行业案例与实践集锦

    简介:阿里云原生中间件行业案例与实践集锦 1.[在线教育行业]Timing App的Serverless实践案例 在用户.流量爆发式增长背景下,Timing App面临着四大挑战: 系统稳定性差.产品 ...

  2. 连续三年上榜!谐云荣获2022「云原生应用优秀案例」、「云原生安全优秀实践」

    2022年6月15日,由中国信息通信研究院.中国通信标准化协会主办的"原生聚力,云数赋能"2022年云原生产业大会在线上召开. 谐云凭借在云原生领域的创新技术和前瞻性实践,斩获多项 ...

  3. 万物互联、应用现代化、云原生新范式,华为云为数字化转型提供最优解

    10月27日,华为云TechWave全球技术峰会(应用现代化)在广州举办.华为云发布"云原生2.0"新范式,并分享应用现代化.万物互联等最新理念及产品进展. 华为云CTO张宇昕发表 ...

  4. 构建实时数据仓库首选,云原生数据仓库技术解密

    阿里云分析型数据库重磅推出基础版,极大降低了用户构建数据仓库门槛.高度兼容MySQL,极低的使用成本和极高的性能,使中小企业也可以轻松的搭建一套实时数据仓库,实现企业数据价值在线化. Analytic ...

  5. 构建实时数据仓库首选,云原生数据仓库AnalyticDB for MySQL技术解密

    阿里云分析型数据库重磅推出基础版,极大降低了用户构建数据仓库门槛.高度兼容MySQL,极低的使用成本和极高的性能,使中小企业也可以轻松的搭建一套实时数据仓库,实现企业数据价值在线化. Analytic ...

  6. 自研云原生数据仓库AnalyticDB再破权威评测TPC-DS世界纪录

    北京时间 2020/5/4 青年节,TPC(全球最知名非盈利的数据管理系统评测基准标准化组织)官网正式上线AnalyticDB TPC-DS成绩,AnalyticDB通过严苛的TPC-DS全流程测试, ...

  7. 剑指云原生数据库 2.0,阿里云发布全新一站式敏捷数据仓库解决方案

    作为基础软件"三驾马车"之一的数据库,其发展历程可追溯到60年前:从上世纪50年代的层次数据库.网状数据库,70年代的关系型数据库,再到90年代的关系型数据库.数据仓库.PC单机数 ...

  8. CSDN 独家对话阿里云贾扬清、华先胜等大咖,剧透阿里云原生技术密码

    新一轮科技革命和产业变革正重塑全球发展格局,以云计算为代表的新一代信息技术相互渗透,成为数字经济智能和创新发展新引擎. 过去 12 年,人们对云计算的讨论从原来的"为什么上云",到 ...

  9. 云原生是全云开发的敲门砖?蒋涛独家对话阿里云贾扬清、华先胜等大咖

    新一轮科技革命和产业变革正重塑全球发展格局,以云计算为代表的新一代信息技术相互渗透,成为数字经济智能和创新发展新引擎. 过去 12 年,人们对云计算的讨论从原来的"为什么上云",到 ...

最新文章

  1. 通过脚本案例学习shell(五) 通过创建DNS脚本一步一步教你将一个普通脚本规范到一个生产环境脚本...
  2. java多态口诀,Java之路---Day12(多态),多态Java
  3. 《大话数据结构》第9章 排序 9.3 冒泡排序(下)
  4. 实现锁死的有滚动条的div的表格(datagird)
  5. 微服务中的异步消息通讯
  6. java第二部分项目_Java_第二次作业:项目构思与实现
  7. 微信小程序php java_PHP实现微信小程序用户授权的工具类
  8. 重启小狼毫输入法,rime输入法重启
  9. JavaScript-数组相关作业
  10. 157. PHP 闭标签
  11. 数据结构(C语言版)严蔚敏李冬梅(第2版)课后习题答案
  12. 机器翻译市场需求调研报告
  13. PPT 去除排练计时
  14. matlab角度和弧度的互换_MATLAB弧度与角度转换 -
  15. 使用dkms将驱动加入内核模块
  16. LinkedBlockingQueue 实现生产者消费者模型
  17. 时钟芯片 服务器,通用实时时钟芯片
  18. c语言用pow求x的y次幂,使用系统函数pow(x,y)计算x的y次方的值,注意包含头文件math.h...
  19. Python的大数据之旅(1)---Anaconda与WingIDE安装
  20. 矩阵理论——线性空间

热门文章

  1. python中的方法
  2. 微信小程序学习第6周————模块化
  3. [cesium] | 视频融合 | 自定义视频投放
  4. CAN接口测试工装研究
  5. redist 在linux上的安装教程
  6. 安超云荣获“国民云计算品牌”值得关注奖
  7. 计算机相关专业术语中英文对照
  8. 神经结构化学习 2 使用自然图进行训练 Neural Structured Learning - Part 2: Training with natural graphs
  9. brand.php dnfire.cn_火灾报警系统品牌
  10. IT审计实务沟通与实践讨论之三IT审计中IT与财务的角度转换