kafka connect

在本周的白板演练中,MapR的高级产品营销经理Ankur Desai描述了Apache Kafka Connect和REST API如何简化和提高在处理来自包括旧数据库或数据仓库在内的各种数据源的流数据时的敏捷性。 他还解释了当您使用MapR Streams与Kafka进行数据传输时,此体系结构的差异。

其他资源:

  • 卡罗尔·麦克唐纳(Carol MacDonald)的博客教程“使用Spark Machine Learning,Streaming和Kafka API监视实时Uber数据”
  • Tugdual Grall撰写的使用Kafka API的示例程序的“ MapR Streams入门”博客教程
  • Apache Flink简介: Ellen Friedman和Kostas Tzoumas撰写的《 实时和超越流处理》一书在线免费阅读

这是完整的视频转录:

嗨,我是Ankur Desai。 我在MapR的产品团队中工作。 欢迎来到我的白板演练。 今天,我将讨论流架构,以及该架构的新进展如何帮助使该架构更加敏捷和简单。 让我们谈谈一切。

这是典型的流架构。 在左侧,您拥有诸如社交媒体,传感器和各种数据之类的数据源。 然后,您将使用Flume之类的数据收集器从这些数据源获取数据,然后Flume充当Kafka的生产者。 另外,请记住您也有旧式数据源,例如数据库和数据仓库。 要从这些来源获取数据并放入Kafka中,通常可以使用充当Kafka生产者的自定义代码,也可以再次使用数据收集器。

数据放入Kafka后,Kafka将充当流式体系结构的消息传递系统。 它充当传输层。 将数据保存在Kafka中后,Kafka便可以将数据提供给流处理引擎,例如Spark Streaming和Flink。 流处理层用于ATL,分析和聚合之类的目的。 处理完成后,您希望将结果存储在持久层中,以使其可用于下游应用程序。

让我们谈谈如何使整个体系结构更敏捷,更简单。 让我们从REST API开始。 REST API,让我在这里画一下进行解释。 REST API允许任何环境中的任何编程语言使用SJDP将数据写入Kafka。 同时,请记住,我们还具有经常需要与Kafka对话的旧数据源。 该社区已经开发了一个工具集,即称为Kafka Connect的框架。 Kafka Connect是一组预先建立的连接器,可以帮助您将数据从旧系统导入Kafka。 现在,您可以使用Kafka Connect在Kafka中进出数据。 结果,整个架构更加简单。

Kafka Connect提供了预构建的连接器,因此您不必每次都要在旧系统中进出数据时都编写自定义代码。 另外,Kafka Connect不仅可以用作数据导入工具,还可以将数据从Kafka导出到某些目标。 此外,让我们讨论如何将这种体系结构的某些组件融合到一个平台,一个集群,一个系统中。

借助MapR融合数据平台,我们用MapR Streams替换了Kafka,而后者使用了相同的API。 您所有的Kafka应用程序也将在MapR上运行。 MapR融合数据平台将传输处理和持久性的所有必需组件融合到一个集群,一个系统中的一个平台上。 您在此红色方框内看到的所有内容实际上都在同一集群中的同一平台上运行。 所有这些都融合在MapR上。 这实际上有助于消除不同群集之间的数据移动。 结果,我们扩展了敏捷性和简单性的概念,因为现在您不必在不同集群之间移动数据。 这减少了等待时间,并引入了以前没有的架构简化。

在这里,您可以使用MapR融合数据平台使体系结构更简单,更灵活。 谢谢收看 如有任何疑问,请随时在下面写下评论。

翻译自: https://www.javacodegeeks.com/2016/12/kafka-connect-mapr.html

kafka connect

kafka connect_Kafka Connect在MapR上相关推荐

  1. Kafka Connect在MapR上

    在本周的白板演练中,MapR的高级产品营销经理Ankur Desai描述了Apache Kafka Connect和REST API如何简化和提高在处理来自包括旧数据库或数据仓库在内的各种数据源的流数 ...

  2. kafka streams_Kafka REST Proxy MapR Streams入门

    kafka streams MapR生态系统软件包2.0(MEP)随附了一些与MapR流有关的新功能: 用于MapR Streams的Kafka REST代理为MapR Streams和Kafka集群 ...

  3. Kafka REST Proxy for MapR Streams入门

    介绍 MapR生态系统软件包2.0(MEP)随附了一些与MapR流有关的新功能: MapR Streams的Kafka REST代理为MapR Streams和Kafka集群提供RESTful接口,以 ...

  4. kafka 丢弃数据_Kafka史上最详细原理总结下

    3.Partition Replication原则 Kafka高效文件存储设计特点 Kafka把topic中一个parition大文件分成多个小文件段,通过多个小文件段,就容易定期清除或删除已经消费完 ...

  5. #博学谷it学习技术支持#kafka及异步通知文章上下架

    #博学谷it学习技术支持#kafka及异步通知文章上下架 目录: 一.自媒体文章上下架 二.Kafka概述 三.kafka安装配置 四.kafka入门 五.kafka高可用设计 六.kafka生产者详 ...

  6. 如何在Schlage Connect Smart Lock上启用休假模式

    If you're going on vacation and will be away from home for any significant amount of time, it might ...

  7. 骑士卡:基于Kafka搭建消息中心,上亿消息推送轻松完成

    全球购骑士卡是国内领先的会员制特权电商平台,汇聚国内外"吃喝玩乐买"超 300 项会员专属优惠特权.全球购骑士卡基于移动互联生活方式,打通线上.线下消费场景,汇集时下热门.高频的商 ...

  8. k8s kafka集群 连接不上_图解 K8s 核心概念和术语

    我第一次接触容器编排调度工具是 Docker 自家的 Docker Swarm,主要解决当时公司内部业务项目部署繁琐的问题,我记得当时项目实现容器化之后,花在项目部署运维的时间大大减少了,当时觉得这玩 ...

  9. Kafka如何实现每秒上百万的超高并发写入?

    这篇文章来聊一下 Kafka 的一些架构设计原理,这也是互联网公司面试时非常高频的技术考点. Kafka 是高吞吐低延迟的高并发.高性能的消息中间件,在大数据领域有极为广泛的运用.配置良好的 Kafk ...

最新文章

  1. 1.解决python中导入包不成功的问题(出现CondaHTTPError: HTTP 000 CONNECTION FAILED for url问题)
  2. git提交过滤target文件 idea_找不到或无法加载主类(IDEA中启动spring boot项目)
  3. JCheckBox用法
  4. python dataframe loc函数_python pandas.DataFrame.loc函数使用详解
  5. [转]12篇学通C#网络编程——第二篇 HTTP应用编程(上)
  6. system函数和fork-exec机制
  7. 机器人学习--pitch yaw roll
  8. 印花固浆在水性印花中的作用
  9. php 获取某周的最后一天,PHP获取本周首先天和最后一天
  10. win10键盘锁住了怎么解决
  11. 华为2019校招笔试题之处理字符串(python版)
  12. html手机保存图片不显示,手机保存的图片在相册显示不了解决方法
  13. math_(函数数列)极限的含义误区和符号梳理/邻域去心邻域邻域半径
  14. 第三方对接-支付宝支付
  15. 安利的短片 安利的真面目 zt
  16. Mac电脑快速切换输入法!自动切换输入法!
  17. OpenGL超级宝典(第7版)之第十二章管线监控
  18. Web 安全:PKI 扫盲
  19. 第4课:Scratchjr运动指令
  20. 百家争鸣前夕,八千字说透「波卡平行链插槽拍卖」

热门文章

  1. CF1500C Matrix Sorting(拓扑排序)
  2. 11.16 模拟:总结
  3. P2231-[HNOI2002]跳蚤【容斥】
  4. jzoj5223-B【矩阵乘法】
  5. ssl提高组周六备考赛【2018.10.20】
  6. ssl2331OJ1373-鱼塘钓鱼 之1【纯贪心】
  7. 【期望】关灯游戏(金牌导航 期望-8)
  8. HDU5322 - cdq分治FFT加速dp
  9. 动态规划训练20 [Treats for the Cows POJ - 3186 ]
  10. Spark SQL(八)之基于物品的相似度公式