环境版本: HDP-2.5.3
注意:HDP中Kafka broker的端口是6667,不是9092
如果只sink到kafka请看这篇:基于HDP使用Flume采集MySQL中数据传到Kafka


前言

有两种方式可以将数据通过flume导入hive中,一是直接sink到hive中,二是sink到hdfs中,然后在hive中建个外部表。直接sink到hive中相对麻烦一些,需要加入需要的jar包,而且hive表需要分桶、开启事务、保存为ORC格式。其实搞清楚了也不麻烦,但是本文中agent.sources.r1.type使用org.keedio.flume.source.SQLSource,传入的字段全变成了加上双引号的字符串,处理起来比较麻烦。所以我最终选用了sink到hdfs中,可以通过OpenCSVSerde去掉双引号。现给出了两种方案,各取所需吧。如有别的方式去掉双引号,欢迎下方留言。

文章目录

  • 前言
  • 1.将所需jar包放入Flume安装目录lib下
  • 2.sink到hdfs
    • 2.1 编写mysql_kafka_hdfs.conf
    • 2.2 建外部表

基于HDP使用Flume实时采集MySQL中数据传到Kafka+HDFS或Hive相关推荐

  1. 基于HDP使用Flume实时采集MySQL中数据传到Kafka

    注意:HDP中Kafka broker的端口是6667,不是9092 如有需要请看:基于HDP使用Flume实时采集MySQL中数据传到Kafka+Hive/HDFS 1.将flume-ng-sql- ...

  2. Flume实时采集mysql数据到kafka中并输出

    环境说明 centos7 flume1.9.0(flume-ng-sql-source插件版本1.5.3) jdk1.8 kafka 2.1.1 zookeeper(这个我用的kafka内置的zk) ...

  3. 采用Flume实时采集和处理数据

    它已成功安装Flume在...的基础上.本文将总结使用Flume实时采集和处理数据,详细过程,如下面: 第一步,在$FLUME_HOME/conf文件夹下,编写Flume的配置文件,命名为flume_ ...

  4. 基于FPG的温湿度实时采集与显示

    AHT10.OLED,Verilog 文章目录 前言 一.项目介绍 二.主要模块分析 1.AHT10 2.OLED 总结 前言 这是自己一开始做的,可能有很多不对的地方如若不对希望各位大佬能帮忙指出, ...

  5. 第二章 数据采集模块之FlinkCDC实时采集Mysql业务数据(源码资料见文末)

    1.Mysql数据准备 (1)创建实时同步数据库 create database flink_gmall (2)将Mysql.sql文件导入到Mysql中 source /opt/data/Mysql ...

  6. kafka跨库同步mysql表_canal实时同步mysql表数据到Kafka

    准备 对于自建 MySQL , 需要先开启 Binlog 写入功能,配置 binlog-format 为 ROW 模式,my.cnf 中配置如下 [mysqld] log-bin=mysql-bin ...

  7. Maxwell 配置实时将MySQL数据同步到Kafka

    文章目录 环境准备 安装maxwell 下载地址 安装 创建元数据存放数据库 被同步的数据库上创建用于数据复制的账号,并授权 配置mysql同步到kafka任务 运行任务 全表同步 可能遇到的问题 M ...

  8. 实时监控Mysql等数据库变化_进行数据同步_了解Maxwell_--MaxWell工作笔记001

    1.Maxwell 是一个读取 MySQL binlogs日志,这样就可以知道数据库修改的内容_ 并将修改行字段的更新用json的格式 ,写入 Kafka, Kinesis, RabbitMQ, Go ...

  9. ELK采集MySQL慢日志实现

    文章目录 一.ELK采集MySQL慢日志架构 二.filebeat 三.logstash 四.es+kibana 一.ELK采集MySQL慢日志架构 MySQL 服务器安装 Filebeat 作为 a ...

最新文章

  1. android layerlist bitmap,android – 在LayerListDrawable中更改Bitmap Drawable
  2. C语言程序设计 计算个人所得税 浙大版,《C语言及程序设计》实践参考——个人所得税计算器switch语句版...
  3. 【火炉炼AI】机器学习013-用朴素贝叶斯分类器估算个人收入阶层
  4. 关于java static 关键字
  5. ExtJS 4 Beta 2预览:Ext.Brew包
  6. TypeScript 枚举(Enum)
  7. js中的引用类型-object
  8. CocoaPods 添加第三方库报错
  9. crontab每小时运行一次(转)
  10. poj——3349 哈希加模拟
  11. 下载全球任意台站的连续地震数据
  12. 如何获取win10当前桌面背景壁纸
  13. 根据设计稿,用JS计算rem的值
  14. 超详细从零记录Hadoop2.7.3完全分布式集群部署过程
  15. ButterKnife 懒人神器 使用步骤 备忘
  16. 手码-在U-boot SPL 移植新的PMIC芯片驱动
  17. ubuntu 双屏显示的设置
  18. 【工作总结】工作感受
  19. HNU-电子测试平台与工具-元器件及测量基础
  20. 计算机打印状态错误,打印机出现错误状态是怎么回事,教您解决办法

热门文章

  1. 51 《格鲁夫给经理人的第一课》 -豆瓣评分8.8
  2. 异步FIFO的原理以及可综合的Verilog代码
  3. Java校招面经_小米java校招面经,面试题整理(一面)
  4. 2020年国考申论备考:评价类(观点)题和理解类题目的辨析
  5. 广告学本科--现代管理学--[00107]
  6. Ubuntu 16.04 下 旋转显示器屏幕 竖屏显示
  7. 元界快讯|中手游去年营收微增净利下滑,“仙剑”元宇宙今夏开测
  8. 人工智能面试总结:160个机器学习面试题,赶紧先考考自己!
  9. 书单来了!大厂的技术牛人在读什么:阿里篇
  10. java开发微信公众号:微信公众号对接