kafka streams

介绍

MapR生态系统软件包2.0(MEP)随附了一些与MapR流有关的新功能:

  • 用于MapR Streams的Kafka REST代理为MapR Streams和Kafka集群提供RESTful接口,以使用和生成消息并执行管理操作。
  • Kafka Connect for MapR Streams是一个实用程序,用于在MapR Streams与Apache Kafka和其他存储系统之间流式传输数据。

MapR生态系统软件包(MEP)是一种提供与核心升级脱钩的生态系统升级的方法-允许您独立于聚合数据平台升级工具。 您可以在本文中进一步了解MEP 2.0。

在此博客中,我们描述了如何使用REST代理向MapR流发布消息和使用消息。 REST代理是对MapR融合数据平台的重要补充,允许任何编程语言使用MapR流。

MapR Streams工具随附的Kafka REST Proxy可以与MapR Streams一起使用(默认),也可以与Apache Kafka混合使用。 在本文中,我们将重点介绍MapR流。 <!–更多–>

先决条件

  • 具有MEP 2.0的MapR融合数据平台5.2

    • 使用MapR Streams工具
  • curl,wget或任何HTTP / REST客户端工具

创建MapR流和主题

流是主题的集合,您可以通过以下方式将其分组管理:

  1. 设置适用于该流中所有主题的安全策略
  2. 为流中创建的每个新主题设置默认的分区数
  3. 为流中每个主题的消息设置生存时间

您可以在文档中找到有关MapR Streams概念的更多信息。

在您的Mapr群集或沙盒上,运行以下命令:

$ maprcli stream create -path /apps/iot-stream -produceperm p -consumeperm p -topicperm p$ maprcli stream topic create -path /apps/iot-stream -topic sensor-json -partitions 3$ maprcli stream topic create -path /apps/iot-stream -topic sensor-binary -partitions 3

启动Kafka控制台的生产者和消费者

打开两个终端窗口,并使用以下命令运行使用者的Kafka实用程序:

消费者

  • 主题传感器-json
$ /opt/mapr/kafka/kafka-0.9.0/bin/kafka-console-consumer.sh --new-consumer --bootstrap-server this.will.be.ignored:9092 --topic /apps/iot-stream:sensor-json
  • 主题传感器二进制
$ /opt/mapr/kafka/kafka-0.9.0/bin/kafka-console-consumer.sh --new-consumer --bootstrap-server this.will.be.ignored:9092 --topic /apps/iot-stream:sensor-binary

这两个终端窗口可让您查看有关不同主题的消息

使用Kafka REST代理

检查主题元数据

端点/topics/[topic_name]允许您获取有关该主题的一些信息。 在MapR Streams中,主题是路径标识的流的一部分; 要使用REST API使用主题,您必须使用完整路径,并在URL中进行编码; 例如:

  • /apps/iot-stream:sensor-json将使用%2Fapps%2Fiot-stream%3Asensor-json进行编码

运行以下命令,以获取有关sensor-json主题的信息

$ curl -X GET  http://localhost:8082/topics/%2Fapps%2Fiot-stream%3Asensor-json

注意:为简单起见,我从运行Kafka REST代理的节点上运行命令,因此可以使用localhost

您可以通过添加以下Python命令,以一种漂亮的方式打印JSON:

$ curl -X GET  http://localhost:8082/topics/%2Fapps%2Fiot-stream%3Asensor-json | python -m json.tool

默认流

如上所述,流路径是您必须在命令中使用的主题名称的一部分。 但是可以将MapR Kafka REST代理配置为使用默认流。 为此,您应该在/opt/mapr/kafka-rest/kafka-rest-2.0.1/config/kafka-rest.properties文件中添加以下属性:

  • streams.default.stream=/apps/iot-stream更改Kafka REST代理配置时,必须使用maprcli或MCS重新启动服务。使用streams.default.stream属性的streams.default.stream是简化URL使用的URL。以应用为例

    • 通过streams.default.stream ,可以使用curl -X GET http://localhost:8082/topics/

    在本文中,所有URL都包含编码的流名称,就像您可以开始使用Kafka REST代理而无需更改配置,也可以将其用于其他流。

发布消息

用于MapR流的Kafka REST代理允许应用程序将消息发布到MapR流。 消息可以作为JSON或二进制内容(base64编码)发送。

要发送JSON消息:

  • 查询应该是HTTP POST
  • 内容类型应为: application/vnd.kafka.json.v1+json
  • 身体:
{"records":[{"value":{"temp" : 10 ,"speed" : 40 ,"direction" : "NW"}  }]
}

完整的请求是:

curl -X POST -H "Content-Type: application/vnd.kafka.json.v1+json" \--data '{"records":[{"value": {"temp" : 10 , "speed" : 40 , "direction" : "NW"}  }]}' \http://localhost:8082/topics/%2Fapps%2Fiot-stream%3Asensor-json

您应该在运行/apps/iot-stream:sensor-json使用者的终端窗口中看到打印的消息。

要发送二进制消息:

  • 查询应该是HTTP POST
  • 内容类型应为: application/vnd.kafka.binary.v1+json
  • 身体:
{"records":[{"value":"SGVsbG8gV29ybGQ="}]
}

请注意, SGVsbG8gV29ybGQ=是在Base64中编码的字符串“ Hello World”。

完整的请求是:

curl -X POST -H "Content-Type: application/vnd.kafka.binary.v1+json" \--data '{"records":[{"value":"SGVsbG8gV29ybGQ="}]}' \http://localhost:8082/topics/%2Fapps%2Fiot-stream%3Asensor-binary

您应该在/apps/iot-stream:sensor-binary使用者正在运行的终端窗口中看到打印的消息。

发送多条消息

HTTP正文的records字段允许您发送多个消息,例如,您可以发送:

curl -X POST -H "Content-Type: application/vnd.kafka.json.v1+json" \--data '{"records":[{"value": {"temp" : 12 , "speed" : 42 , "direction" : "NW"}  }, {"value": {"temp" : 10 , "speed" : 37 , "direction" : "N"}  } ]}' \http://localhost:8082/topics/%2Fapps%2Fiot-stream%3Asensor-json

该命令将发送2条消息,并将偏移量增加2。您可以对二进制内容执行相同的操作,只需在JSON数组中添加新元素即可; 例如:

curl -X POST -H "Content-Type: application/vnd.kafka.binary.v1+json" \--data '{"records":[{"value":"SGVsbG8gV29ybGQ="}, {"value":"Qm9uam91cg=="}]}' \http://localhost:8082/topics/%2Fapps%2Fiot-stream%3Asensor-binary

您可能知道,可以为消息设置密钥,以确保所有具有相同密钥的消息都将到达同一分区。 为此,将key属性添加到消息中,如下所示:

{"records":[{"key": "K001","value":{"temp" : 10 ,"speed" : 40 ,"direction" : "NW"}  }]
}

既然您知道如何使用REST代理将消息发布到MapR Stream主题,那么让我们看看如何使用消息。

消费信息

REST代理还可以用于消费主题消息。 为此,您需要:

  1. 创建使用者实例。
  2. 使用第一次调用返回的URL读取消息。
  3. 如果需要,请删除实例的使用者。

创建使用者实例

以下请求创建使用者实例:

curl -X POST -H "Content-Type: application/vnd.kafka.v1+json" \--data '{"name": "iot_json_consumer", "format": "json", "auto.offset.reset": "earliest"}' \http://localhost:8082/consumers/%2Fapps%2Fiot-stream%3Asensor-json

服务器的响应如下所示:

{"instance_id":"iot_json_consumer","base_uri":"http://localhost:8082/consumers/%2Fapps%2Fiot-stream%3Asensor-json/instances/iot_json_consumer"
}

请注意,我们已经使用/consumers/[topic_name]创建使用者。

后续请求将使用base_uri从主题获取消息。 与任何MapR Streams / Kafka使用者一样, auto.offset.reset定义其行为。 在此示例中,该值设置为earliest ,这意味着使用者将从头开始阅读消息。 您可以在MapR Streams文档中找到有关使用者配置的更多信息。

消费信息

要使用这些消息,只需将Mapr Streams主题添加到使用者实体的URL。

以下请求使用了该主题的消息:

curl -X GET -H "Accept: application/vnd.kafka.json.v1+json" \
http://localhost:8082/consumers/%2Fapps%2Fiot-stream%3Asensor-json/instances/iot_json_consumer/topics/%2Fapps%2Fiot-stream%3Asensor-json

此调用返回JSON文档中的消息:

[{"key":null,"value":{"temp":10,"speed":40,"direction":"NW"},"topic":"/apps/iot-stream:sensor-json","partition":1,"offset":1},{"key":null,"value":{"temp":12,"speed":42,"direction":"NW"},"topic":"/apps/iot-stream:sensor-json","partition":1,"offset":2},{"key":null,"value":{"temp":10,"speed":37,"direction":"N"},"topic":"/apps/iot-stream:sensor-json","partition":1,"offset":3}
]

每次对API的调用都会根据上一次调用的偏移量返回发布的新消息。

请注意,消费者将被销毁:

  • consumer.instance.timeout.ms实例。超时。毫秒设置的空闲时间后(默认值设置为300000毫秒/ 5分钟)
  • 使用REST API调用销毁它(见下文)。

消费二进制格式的消息

如果需要使用二进制消息,则需要更改格式并接受标头,该方法是相同的。

调用此URL为二进制主题创建使用者实例:

curl -X POST -H "Content-Type: application/vnd.kafka.v1+json" \--data '{"name": "iot_binary_consumer", "format": "binary", "auto.offset.reset": "earliest"}' \http://localhost:8082/consumers/%2Fapps%2Fiot-stream%3Asensor-binary

然后使用消息,accept标头设置为application/vnd.kafka.binary.v1+json

curl -X GET -H "Accept: application/vnd.kafka.binary.v1+json" \
http://localhost:8082/consumers/%2Fapps%2Fiot-stream%3Asensor-binary/instances/iot_binary_consumer/topics/%2Fapps%2Fiot-stream%3Asensor-binary

该调用返回JSON文档中的消息,并且该值在Base64中编码

[{"key":null,"value":"SGVsbG8gV29ybGQ=","topic":"/apps/iot-stream:sensor-binary","partition":1,"offset":1},{"key":null,"value":"Qm9uam91cg==","topic":"/apps/iot-stream:sensor-binary","partition":1,"offset":2}
]

删除使用者实例

如前所述,将根据REST Proxy的consumer.instance.timeout.ms配置自动销毁consumer.instance.timeout.ms 。 也可以使用使用者实例URI和HTTP DELETE调用销毁实例,如下所示:

curl -X DELETE http://localhost:8082/consumers/%2Fapps%2Fiot-stream%3Asensor-binary/instances/iot_binary_consumer

结论

在本文中,您学习了如何将Kafka REST代理用于MapR流,该代理允许任何应用程序使用在MapR聚合数据平台中发布的消息。

您可以在MapR文档和以下资源中找到有关Kafka REST代理的更多信息:

  • MapR Streams入门
  • Ted Dunning和Ellen Friedman撰写的“流传输体系结构:使用Apache Kafka和MapR流的新设计”电子书

翻译自: https://www.javacodegeeks.com/2017/01/getting-started-kafka-rest-proxy-mapr-streams.html

kafka streams

kafka streams_Kafka REST Proxy for MapR Streams入门相关推荐

  1. Kafka REST Proxy for MapR Streams入门

    介绍 MapR生态系统软件包2.0(MEP)随附了一些与MapR流有关的新功能: MapR Streams的Kafka REST代理为MapR Streams和Kafka集群提供RESTful接口,以 ...

  2. kafka streams_Kafka REST Proxy MapR Streams入门

    kafka streams MapR生态系统软件包2.0(MEP)随附了一些与MapR流有关的新功能: 用于MapR Streams的Kafka REST代理为MapR Streams和Kafka集群 ...

  3. [Kafka与Spark集成系列一] Spark入门

    欢迎支持笔者新作:<深入理解Kafka:核心设计与实践原理>和<RabbitMQ实战指南>,同时欢迎关注笔者的微信公众号:朱小厮的博客. 欢迎跳转到本文的原文链接:https: ...

  4. 如何使用Kafka API入门Spark流和MapR流

    这篇文章将帮助您开始使用Apache Spark Streaming通过MapR Streams和Kafka API消费和发布消息. Spark Streaming是核心Spark API的扩展,可实 ...

  5. spark和kafka_如何使用Kafka API入门Spark流和MapR流

    spark和kafka 这篇文章将帮助您开始使用Apache Spark Streaming通过MapR Streams和Kafka API消费和发布消息. Spark Streaming是核心Spa ...

  6. kafka connect_Kafka Connect在MapR上

    kafka connect 在本周的白板演练中,MapR的高级产品营销经理Ankur Desai描述了Apache Kafka Connect和REST API如何简化和提高在处理来自包括旧数据库或数 ...

  7. Kafka Connect在MapR上

    在本周的白板演练中,MapR的高级产品营销经理Ankur Desai描述了Apache Kafka Connect和REST API如何简化和提高在处理来自包括旧数据库或数据仓库在内的各种数据源的流数 ...

  8. ip integrator_使用Oracle Data Integrator(和Kafka / MapR流)完善Lambda体系结构

    ip integrator " Lambda体系结构是一种数据处理体系结构,旨在通过利用批处理和流处理方法来处理大量数据. 这种体系结构方法尝试通过使用批处理提供批处理数据的全面而准确的视图 ...

  9. 使用Oracle Data Integrator(和Kafka / MapR流)完善Lambda体系结构

    " Lambda体系结构是一种数据处理体系结构,旨在通过利用批处理和流处理方法来处理大量数据. 这种体系结构方法试图通过使用批处理提供批处理数据的全面而准确的视图,同时使用实时流处理提供在线 ...

最新文章

  1. phonegap+jquerymobile开发android的心得(6)
  2. 博士在读时,把暗恋的师兄变成了老公是种怎样的体验?
  3. php广告任务网源码_THINKPHP仿我爱广告任务网|任务网站源码下载
  4. 设置ArcGIS的外观改回到出厂
  5. PyTorch之Sequential
  6. 十二星座PSD分层海报,治愈心灵,谁见谁爱!
  7. 自实现进程管理器linux,【Linux工具篇】supervisor进程管理器
  8. php操作elasticsearch
  9. 制造业实施大数据战略面临哪些挑战
  10. 建立一个中文名字的文件夹Python
  11. Java开发笔记(一百三十四)Swing的基本对话框
  12. jquery 添加可操作,编辑不可操作
  13. 迅雷有linux版本吗,迅雷 - Linux Wiki
  14. php怎么字符串转成json对象_php如何将字符串转成json_后端开发
  15. Java知识点复习:Day14
  16. html文件打开自动跳转至空白
  17. 【ROM制作工具】小白轻松一键搞定纯净ROM刷机包
  18. cocos2dx layer理解
  19. Z律师:创业项目如何玩转股权众筹?
  20. 排序算法 快速排序【详细步骤图解】

热门文章

  1. CF891B-Gluttony【构造】
  2. P4783-[模板]矩阵求逆
  3. YbtOJ#832-鸽子饲养【凸包,Floyd】
  4. 欢乐纪中某A组赛【2019.7.5】
  5. luoguSP1805,POJ2559-Largest Rectangle in a Histogram【单调栈】
  6. BZOJ1251 序列终结者
  7. Lombok的@Data生成的hashCode和equals方法坑
  8. Hadoop入门(十六)Mapreduce的单表关联程序
  9. 全文搜索!收藏这篇Solr ElasticSearch 长文就可以搞定
  10. Spring 事务原理和使用