在本周的白板演练中,MapR的高级产品营销经理Ankur Desai描述了Apache Kafka Connect和REST API如何简化和提高在处理来自包括旧数据库或数据仓库在内的各种数据源的流数据时的敏捷性。 他还解释了使用MapR Streams与Kafka进行数据传输时此体系结构的差异。

其他资源:

  • 卡罗尔·麦克唐纳(Carol MacDonald)的“使用Spark机器学习,流和Kafka API监视实时Uber数据”博客教程
  • Tugdual Grall撰写的使用Kafka API的示例程序的“ MapR Streams入门”博客教程。
  • Apache Flink简介: Ellen Friedman和Kostas Tzoumas撰写的《 实时和超越流处理》一书在线免费阅读

这是完整的视频转录:

嗨,我是Ankur Desai。 我在MapR的产品团队中工作。 欢迎来到我的白板演练。 今天,我将讨论流式架构以及该架构的新进展如何帮助使该架构更加敏捷和简单。 让我们谈谈这一切如何运作。

这是典型的流架构。 在左侧,您具有诸如社交媒体,传感器和各种数据之类的数据源。 然后,您将使用Flume之类的数据收集器从这些数据源获取数据,然后Flume充当Kafka的生产者。 另外,请记住您也有旧式数据源,例如数据库和数据仓库。 要从这些来源获取数据并放入Kafka中,通常可以使用充当Kafka生产者的自定义代码,也可以再次使用数据收集器。

数据放入Kafka后,Kafka将充当流式体系结构的消息传递系统。 它充当传输层。 将数据保存在Kafka中之后,Kafka便可以将数据提供给流处理引擎,例如Spark Streaming和Flink。 流处理层用于ATL,分析和聚合之类的目的。 处理完成后,您希望将结果存储在持久层中,以使其可用于下游应用程序。

让我们谈谈如何使整个体系结构更敏捷,更简单。 让我们从REST API开始。 REST API,让我在这里画一下进行解释。 REST API允许在任何环境中的任何编程语言使用SJDP将数据写入Kafka。 同时,请记住,我们也有经常需要与Kafka对话的旧数据源。 该社区已经开发了一个工具集,即称为Kafka Connect的框架。 Kafka Connect是一组预先建立的连接器,可以帮助您将数据从旧系统导入Kafka。 现在,您可以使用Kafka Connect在Kafka中进出数据。 结果,整个架构更加简单。

Kafka Connect提供了预构建的连接器,因此您不必每次都要在旧系统中进出数据时都编写自定义代码。 另外,Kafka Connect不仅可以用作数据导入工具,还可以将数据从Kafka导出到某些目标。 此外,让我们谈谈如何将这种体系结构的某些组件融合到一个平台,一个集群,一个系统中。

借助MapR融合数据平台,我们用MapR Streams替换了Kafka,而后者使用了相同的API。 您所有的Kafka应用程序也将在MapR上运行。 MapR融合数据平台将传输处理和持久性的所有必需组件融合到一个集群,一个系统中的一个平台上。 您在此红色方框内看到的所有内容实际上都在同一集群中的同一平台上运行。 所有这些都在MapR上融合。 这实际上有助于消除不同群集之间的数据移动。 结果,我们扩展了敏捷性和简单性的概念,因为现在您不必在不同集群之间移动数据。 这减少了等待时间,并引入了以前没有的架构简化。

在这里,您可以使用MapR融合数据平台使体系结构更简单,更灵活。 谢谢收看 如有任何疑问,请随时在下面写下评论。

翻译自: https://www.javacodegeeks.com/2016/12/kafka-connect-mapr.html

Kafka Connect在MapR上相关推荐

  1. kafka connect_Kafka Connect在MapR上

    kafka connect 在本周的白板演练中,MapR的高级产品营销经理Ankur Desai描述了Apache Kafka Connect和REST API如何简化和提高在处理来自包括旧数据库或数 ...

  2. 1.3 Quick Start中 Step 7: Use Kafka Connect to import/export data官网剖析(博主推荐)

    不多说,直接上干货! 一切来源于官网 http://kafka.apache.org/documentation/ Step 7: Use Kafka Connect to import/export ...

  3. 深入理解Kafka Connect:转换器和序列化

    AI前线导读:Kafka Connect是一个简单但功能强大的工具,可用于Kafka和其他系统之间的集成.人们对Kafka Connect最常见的误解之一是它的转换器.这篇文章将告诉我们如何正确地使用 ...

  4. Kafka: Connect

    转自:http://www.cnblogs.com/f1194361820/p/6108025.html Kafka Connect 简介 Kafka Connect 是一个可以在Kafka与其他系统 ...

  5. Kafka Connect简介

    一. Kafka Connect简介 Kafka是一个使用越来越广的消息系统,尤其是在大数据开发中(实时数据处理和分析).为何集成其他系统和解耦应用,经常使用Producer来发送消息到Broker, ...

  6. SQL Server CDC配合Kafka Connect监听数据变化

    写在前面 好久没更新Blog了,从CRUD Boy转型大数据开发,拉宽了不少的知识面,从今年年初开始筹备.组建.招兵买马,到现在稳定开搞中,期间踏过无数的火坑,也许除了这篇还很写上三四篇. 进入主题, ...

  7. OpenShift 4 之AMQ Streams(2) - 用Kafka Connect访问数据源

    <OpenShift 4.x HOL教程汇总> Kafka Connect是一种可扩展的和可靠的连接Kafka框架与外部系统的框架.通过不同的Connector可以访问如数据库,键值存储, ...

  8. cdc工具 postgresql_SQLServer CDC数据通过Kafka connect实时同步至分析型数据库 AnalyticDB For PostgreSQL及OSS-阿里云开发者社区...

    背景 SQLServer为实时更新数据同步提供了CDC机制,类似于Mysql的binlog,将数据更新操作维护到一张CDC表中. 开启cdc的源表在插入INSERT.更新UPDATE和删除DELETE ...

  9. Kafka Connect使用教程

    1 kafka connect是什么 根据官方介绍,Kafka Connect是一种用于在Kafka和其他系统之间可扩展的.可靠的流式传输数据的工具.它使得能够快速定义将大量数据集合移入和移出Kafk ...

最新文章

  1. 从输入字段读取属性时,HTML编码丢失
  2. Oracle 11g数据库的部署
  3. C语言二分查找法(指针和数组实现)
  4. Topcoder SRM 630div 2
  5. python 脚本_基于Python的ArcGIS脚本编程知识点总结
  6. 前端程序员总结的工作中常用的十大浏览器兼容性问题,初学者瑰宝!
  7. sizeof和strlen区别
  8. 迭代重心法 matlab,重心法
  9. x射线直接投影成像的条件_无损检测之X射线检测实时成像技术分辨率
  10. 浅议 Web 表单设计
  11. 安卓3d游戏引擎_万达院线游戏、莉莉丝推新作;《天龙八部手游》不限号不删档测试开启...
  12. java填充word文档_如何使Word文档可填充但不可编辑
  13. Windows7使用Programmer Dvorak键盘布局
  14. FPGA第一天的学习-LED流水灯
  15. 速度收藏 | 100+大数据开源处理工具汇总
  16. RAP2-DELOS 开源社区版本 (后端 API 服务器)
  17. 教你使用shell脚本打印五角星
  18. 11.18C语言练习题
  19. 利用DPCM编码进行图像压缩
  20. 指纹及设备检索:zoomeye(入门)

热门文章

  1. Java 父类子类的对象初始化过程
  2. Spring 整合 Quartz 分布式调度
  3. Windows访问Linux的Tomcat,显示无法连接
  4. Hibernate之映射
  5. 创建对象并且使用对象的属性和方法
  6. Android public class MyApplication extends MultiDexApplication使用
  7. expect() php,Linux expect 的安装
  8. java_basic_review(5)java反射荔枝
  9. java锁_Java锁
  10. jdk12 switch_玩JDK 12的Switch表达式