最近在做实时报警的机制,显然我需要程序每次重启时都读取最新数据。但是寻找了半天无论是kafka的java客户端还是python客户端都没有这样的设置参数。没办法只能自己实现了,思路有两种。

  1. 直接操作zookeeper,因为kafka默认的consumer以及offset的信息是存贮在zookeeper中的,我们只要将zookeeper中相应的文件夹删掉,再连接kafka时我们就像新的consumer一样,会从最新数据开始读取
  2. 使用seek_to_end函数,seek_to_end会直接将位置定位到最新数据。但是在之前需要poll一次数据,不然会报没有分配partition的错误。这说明我们的框架也是懒加载的,只有在具体poll数据的时候才会分配partition。kafka-pyhton的样例代码如下:
    from kafka import KafkaConsumer
    consumer = KafkaConsumer('test', group_id='zhy_flow',
    max_poll_records=10)
    res = consumer.poll(10)
    consumer.seek_to_end()
    for msg in consumer:
    print (msg)

kafka consumer 如何设置每次重启时从最新数据开始读取相关推荐

  1. pm2 部署 nuxt3.js 项目并设置服务器重启时项目自动重启

    前言 众所周知,nuxt3.js是基于vue开发ssr,seo的项目比较好的框架,那么开发完成项目,如何部署nuxt项目也是比较重要的,接下来就记录一下我在开发中是如何部署的. 我之前写过一篇vue ...

  2. java consumer.poll_java – 无法在kafka consumer下设置’max.poll.records’,其中cons.poll仍然返回分区下的所有记录...

    我创建了多线程消费者应用程序来处理各种分区. 查看各种博客,我开始了解'max.poll.records'属性,以便控制来自给定主题,分区的记录集.(因此它可以很快从记录循环中出来,因此调用cons. ...

  3. jquery+bootstrap实现tab切换, 每次切换时都请求数据, 点击提交分别向不同的地址提交数据...

    今天一个朋友叫帮做一个tab切换, 每一个tab内容区域都是从后台取出的数据, 这些数据要用表格的形式显示处理, 并且表格的内容区域可以修改, 如下所示: 例子查看请演示查看. 截图如图所示: 实现步 ...

  4. bootstrap tabale 点击_jquery+bootstrap实现tab切换, 每次切换时都请求数据, 点击提交分别向不同的地址提交数据...

    今天一个朋友叫帮做一个tab切换, 每一个tab内容区域都是从后台取出的数据, 这些数据要用表格的形式显示处理, 并且表格的内容区域可以修改, 如下所示: 例子查看请演示查看. 截图如图所示: 实现步 ...

  5. 解决win10 安装dnw驱动,每次重启都得禁用数字签名。解决命令行操作,设置元素数据时出错。电脑关闭Secure Boot

    解决win10 安装驱动,每次重启都得禁用数字签名 第一步.将电脑关闭Secure Boot 以我的华硕笔记本电脑为例: 1.重启电脑,按住 F2 进入 bios 模式.(其他电脑自行百度) 2.按 ...

  6. 使用spark.streaming.kafka.consumer.poll.ms和reconnect.backoff.ms解决spark streaming消费kafka时任务不稳定的问题

    问题描述 在用spark streaming程序消费kafka的数据时,遇到了一个神奇的现象:同样的数据量.相似的数据,在消费时,有些批次的数据在做map操作时神奇的多了40多秒,具体看下面的数据:在 ...

  7. kafka配置文件 中文乱码_使用kafka consumer api时,中文乱码问题

    使用Intelli idea调试kafka low consumer时,由于broker存储的message有中文, idea中console端是可以正确显示的 然后mvn package打包到服务器 ...

  8. 【Excel】设置每次双击Excel文件时,打开新的excel进程

    当打开着excel文件,用Alt+Tab进行切换时,按一次会无法切换,要按两次Alt+Tab才行,非常不方便.(不知道如何修改此设置) 于是改了下,让excel每次打开时,打开新的excel进程,这样 ...

  9. Kafka系列之:不重启kafka集群设置kafka topic数据保留时间

    Kafka系列之:不重启kafka集群设置kafka topic数据保留时间 一.kafka topic数据保留3天的bash命令 二.查看kafka删除数据日志 三.批量设置上千个topic保留3天 ...

  10. Kafka Consumer端的一些解惑

    2019独角兽企业重金招聘Python工程师标准>>> 最近一直忙着各种设计和文档,终于有时间来更新一点儿关于kafka的东西.之前有一篇文章讲述的是kafka Producer端的 ...

最新文章

  1. 关于SAP BW提示“Carry out repairs in non-original only
  2. 【渝粤题库】广东开放大学 质量管理 形成性考核 (2)
  3. EasyNVR、EasyDSS二次开发之:RTMP、HLS流在web页面进行无插件播放示例Demo代码
  4. 爬虫python软件准备_工具准备的差不多了,接下来就是python爬虫的封装了
  5. 一万个“无序”数查找两个重复数,在O(N)的基础上再快一点
  6. SQL删除重复数据,保留ID最大的一条
  7. Android7.0的xposed框架,Android 7.x 安装Xposed框架
  8. ip地址块的聚合,计算其聚合后的可用地址数
  9. Andriod获取本机ip地址
  10. java中怎么改变白天模式,android 白天黑夜模式切换例子源码
  11. OpenBmc开发13:添加传感器(fan)
  12. 快播关闭服务器,你怎么看?
  13. 腾讯云永久修改主机名
  14. 解耦java_工厂模式实现解耦
  15. 网络安全面试、实习、校招经验打包分享
  16. PCB如何添加矢量图形logo
  17. Brave浏览器推出首个基于隐私的广告平台
  18. Unity 制作鼠标光标拖尾
  19. Tio-Android简单使用篇
  20. 3dmax+vray学习教程

热门文章

  1. 老猿Python博客文章目录索引
  2. python使用docx模块读写docx文件的方法与docx模块常用方法详解
  3. 如何查看电脑本地IP+端口号
  4. 最新2021计算机排名中国大学排名,2020-2021年计算机类专业排名_中国大学本科教育按专业类排行榜_中国科教评价网...
  5. 百度 linux格式c盘指令,Dos指令直接将gho文件还原到C盘的指令怎么写
  6. 分类问题——逻辑回归
  7. Python爬虫实战案例讲解——爬虫爬取地铁线路图
  8. 最新价值800元的720全景云系统源码 可生成小程序带PC端 附新手搭建教程
  9. ld.exe: cannot find -l?eclipse上用C/C++时,如何链接静态库?
  10. 常微分方程各种类型方程表格汇总