基于HDP使用Flume实时采集MySQL中数据传到Kafka+HDFS或Hive
环境版本: HDP-2.5.3
注意:HDP中Kafka broker的端口是6667,不是9092
如果只sink到kafka请看这篇:基于HDP使用Flume采集MySQL中数据传到Kafka
前言
有两种方式可以将数据通过flume导入hive中,一是直接sink到hive中,二是sink到hdfs中,然后在hive中建个外部表。直接sink到hive中相对麻烦一些,需要加入需要的jar包,而且hive表需要分桶、开启事务、保存为ORC格式。其实搞清楚了也不麻烦,但是本文中agent.sources.r1.type使用org.keedio.flume.source.SQLSource,传入的字段全变成了加上双引号的字符串,处理起来比较麻烦。所以我最终选用了sink到hdfs中,可以通过OpenCSVSerde去掉双引号。现给出了两种方案,各取所需吧。如有别的方式去掉双引号,欢迎下方留言。
文章目录
- 前言
- 1.将所需jar包放入Flume安装目录lib下
- 2.sink到hdfs
- 2.1 编写mysql_kafka_hdfs.conf
- 2.2 建外部表
基于HDP使用Flume实时采集MySQL中数据传到Kafka+HDFS或Hive相关推荐
- 基于HDP使用Flume实时采集MySQL中数据传到Kafka
注意:HDP中Kafka broker的端口是6667,不是9092 如有需要请看:基于HDP使用Flume实时采集MySQL中数据传到Kafka+Hive/HDFS 1.将flume-ng-sql- ...
- Flume实时采集mysql数据到kafka中并输出
环境说明 centos7 flume1.9.0(flume-ng-sql-source插件版本1.5.3) jdk1.8 kafka 2.1.1 zookeeper(这个我用的kafka内置的zk) ...
- 采用Flume实时采集和处理数据
它已成功安装Flume在...的基础上.本文将总结使用Flume实时采集和处理数据,详细过程,如下面: 第一步,在$FLUME_HOME/conf文件夹下,编写Flume的配置文件,命名为flume_ ...
- 基于FPG的温湿度实时采集与显示
AHT10.OLED,Verilog 文章目录 前言 一.项目介绍 二.主要模块分析 1.AHT10 2.OLED 总结 前言 这是自己一开始做的,可能有很多不对的地方如若不对希望各位大佬能帮忙指出, ...
- 第二章 数据采集模块之FlinkCDC实时采集Mysql业务数据(源码资料见文末)
1.Mysql数据准备 (1)创建实时同步数据库 create database flink_gmall (2)将Mysql.sql文件导入到Mysql中 source /opt/data/Mysql ...
- kafka跨库同步mysql表_canal实时同步mysql表数据到Kafka
准备 对于自建 MySQL , 需要先开启 Binlog 写入功能,配置 binlog-format 为 ROW 模式,my.cnf 中配置如下 [mysqld] log-bin=mysql-bin ...
- Maxwell 配置实时将MySQL数据同步到Kafka
文章目录 环境准备 安装maxwell 下载地址 安装 创建元数据存放数据库 被同步的数据库上创建用于数据复制的账号,并授权 配置mysql同步到kafka任务 运行任务 全表同步 可能遇到的问题 M ...
- 实时监控Mysql等数据库变化_进行数据同步_了解Maxwell_--MaxWell工作笔记001
1.Maxwell 是一个读取 MySQL binlogs日志,这样就可以知道数据库修改的内容_ 并将修改行字段的更新用json的格式 ,写入 Kafka, Kinesis, RabbitMQ, Go ...
- ELK采集MySQL慢日志实现
文章目录 一.ELK采集MySQL慢日志架构 二.filebeat 三.logstash 四.es+kibana 一.ELK采集MySQL慢日志架构 MySQL 服务器安装 Filebeat 作为 a ...
最新文章
- android layerlist bitmap,android – 在LayerListDrawable中更改Bitmap Drawable
- C语言程序设计 计算个人所得税 浙大版,《C语言及程序设计》实践参考——个人所得税计算器switch语句版...
- 【火炉炼AI】机器学习013-用朴素贝叶斯分类器估算个人收入阶层
- 关于java static 关键字
- ExtJS 4 Beta 2预览:Ext.Brew包
- TypeScript 枚举(Enum)
- js中的引用类型-object
- CocoaPods 添加第三方库报错
- crontab每小时运行一次(转)
- poj——3349 哈希加模拟
- 下载全球任意台站的连续地震数据
- 如何获取win10当前桌面背景壁纸
- 根据设计稿,用JS计算rem的值
- 超详细从零记录Hadoop2.7.3完全分布式集群部署过程
- ButterKnife 懒人神器 使用步骤 备忘
- 手码-在U-boot SPL 移植新的PMIC芯片驱动
- ubuntu 双屏显示的设置
- 【工作总结】工作感受
- HNU-电子测试平台与工具-元器件及测量基础
- 计算机打印状态错误,打印机出现错误状态是怎么回事,教您解决办法
热门文章
- 51 《格鲁夫给经理人的第一课》 -豆瓣评分8.8
- 异步FIFO的原理以及可综合的Verilog代码
- Java校招面经_小米java校招面经,面试题整理(一面)
- 2020年国考申论备考:评价类(观点)题和理解类题目的辨析
- 广告学本科--现代管理学--[00107]
- Ubuntu 16.04 下 旋转显示器屏幕 竖屏显示
- 元界快讯|中手游去年营收微增净利下滑,“仙剑”元宇宙今夏开测
- 人工智能面试总结:160个机器学习面试题,赶紧先考考自己!
- 书单来了!大厂的技术牛人在读什么:阿里篇
- java开发微信公众号:微信公众号对接