Canal Java 入门与使用

0、前言

​ 在如今时代数据是最关键的,大的数据量势必会影响用户体验,在我的日常开发中遇到了一个类似的问题,由于数据库中数据量过于庞大造成查询效率低,决定采用redis来存取最新的数据,由于系统为其它语言编写本人并不擅长,便采取canal来通过增量的方式更新数据。下面让我们了解一下canal。

1、什么是canal

  • canal 直译为管道、渠道、水道,主要用途是基于 MySQL 数据库增量日志解析,提供增量数据订阅和消费

以上介绍来自于官网介绍。我们可以简单把canal理解为一个同步增量数据的工具。

上图为官方给出的示意图,可以看到canal把自己伪装成一个mysql的slave,架起了MySQL与其他软件之间的桥梁。

canal的工作原理就是把自己伪装成MySQL slave,模拟MySQL slave的交互协议向MySQL Mater发送 dump协议,MySQL mater收到canal发送过来的dump请求,开始推送binary log给canal,然后canal解析binary log,再发送到存储目的地,比如MySQL,Kafka,Elastic Search等等。

2、canal能做什么

canal能做什么换个说法就是数据同步有什么用?

由于canal数据同步不是全量同步,而是增量同步。基于binary log增量订阅和消费,canal可以做:

  • 数据库镜像
  • 数据库实时备份
  • 索引构建和实时维护(拆分异构索引、倒排索引等)
  • 业务 cache 刷新
  • 带业务逻辑的增量数据处理

注释:Binary log为数据库二进制文件主要记录所有数据表结构变更以及修改的二进制日志。

3、如何使用canal

3.1首先你要有一个数据库

当前的 canal 支持源端 MySQL 版本包括 5.1.x , 5.5.x , 5.6.x , 5.7.x , 8.0.x

MySQL安装可以查看之前的文章:

3.1.1创建用户

然后需要在MySQL中添加一个用户用于数据同部使用,并授予相关表权限

-- 使用命令登录:mysql -u root -p
-- 创建用户 用户名:canal 密码:Canal@123456
create user 'canal'@'%' identified by 'canal';
-- 授权 *.*表示所有库
grant SELECT, REPLICATION SLAVE, REPLICATION CLIENT on *.* to 'canal'@'%' identified by 'canal';

3.1.2修改配置文件

在MySQL的配置文件my.cnf中添加如下配置

[mysqld]
# 打开binlog
log-bin=mysql-bin
# 选择ROW(行)模式
binlog-format=ROW
# 配置MySQL replaction需要定义,不要和canal的slaveId重复
server_id=1

3.1.3检查配置是否生效

修改完成配置后重启MySQL服务,使用命令检查配置是否生效,

查看是否打开binlog模式

show variables like 'log_bin'

查看binlog日志文件列表

show binary logs

查看当前正在写入的binlog文件

show master status

到此MySQL配置已经全部搞定,暂时告一段落。

3.2安装cancal

3.2.1下载canal

可以从官网下载:https://github.com/alibaba/canal/releases

(可能需要加速)

下载下图圈出版本即可。

cd /usr/local/canal
ls
tar -zxvf canal.deployer-1.1.4.tar.gz

下载完成后上传服务器,解压缩到自己喜欢的路径即可,接下来需要对canal进行配置

3.2.2配置canal

打开配置文件conf/example/instance.properties,其中需要修改内容如下:

# 数据库地址
canal.instance.master.address=127.0.0.1:3306
# binlog日志名称
canal.instance.master.journal.name=mysql-bin.000001
# mysql主库链接时起始的binlog偏移量
canal.instance.master.position=154
# 在MySQL服务器授权的账号密码
canal.instance.dbUsername=canal
canal.instance.dbPassword=canal
# 以下修改能容可选
# table regex .*\\..*表示监听所有表 也可以写具体的表名,用,隔开
canal.instance.filter.regex=.*\\..*
# mysql 数据解析表的黑名单,多个表用,隔开
canal.instance.filter.black.regex=

配置完成后保存文件

3.2.3运行canal

进入bin目录

./startup.sh

这样就成功启动canal了。

注意

canal默认占用端口11111客户端如果想要连接canal服务需要在Linux中开放11111端口

//开启端口
firewall-cmd --zone=public --add-port=11111/tcp --permanent
//查询端口号11111是否开启:
firewall-cmd --query-port=11111/tcp
//重启防火墙:
firewall-cmd --reload
//查询有哪些端口是开启的:
firewall-cmd --list-port
//禁用端口
firewall-cmd --zone=public --remove-port=11111/tcp --permanent

3.3建立canal客户端

3.3.1引入依赖、修改配置

Canal提供了各种语言的客户端,当Canal监听到binlog变化时,会通知Canal的客户端。不过这里我们会使用GitHub上的第三方开源的canal-starter。地址:https://github.com/NormanGyllenhaal/canal-client

引入依赖:

 <dependency><groupId>top.javatool</groupId><artifactId>canal-spring-boot-starter</artifactId><version>1.2.1-RELEASE</version></dependency>

编写配置文件

canal:destination: example  # canal实例名默认为example可以在配置文件中修改server: 192.168.0.5:11111

3.3.2编写监听器

@CanalTable("history_log")  //需要监听的表
@Component
public class HistoryLogHandler implements EntryHandler<HistoryLog> {//指定表关系实体类@Overridepublic void insert(HistoryLog historyLog) {//新增数据时执行此方法}@Overridepublic void update(HistoryLog before, HistoryLog after) {//更新数据时执行此方法}@Overridepublic void delete(HistoryLog historyLog) {//删除数据时执行此方法}
}

4、总结

canal的好处在于对业务代码没有侵入,因为是基于监听binlog日志去进行同步数据的。实时性也能做到准实时,其实是很多企业一种比较常见的数据同步的方案。

通过上面的学习之后,我们应该都明白canal是什么,它的原理,还有用法。实际上这仅仅只是入门,因为实际项目中我们不是这样玩的…

实际项目我们是配置MQ模式,配合RocketMQ或者Kafka,canal会把数据发送到MQ的topic中,然后通过消息队列的消费者进行处理

Canal的部署也是支持集群的,需要配合ZooKeeper进行集群管理。

Canal还有一个简单的Web管理界面。如果有想看的可以留言告诉我我再写一篇文章。

如果你也喜欢这篇文章,或者对这篇文章有其他见解欢迎留言交流。

一句话与大家共勉:君子慎独,不欺暗室。 卑以自牧,含章可贞。

Canal Java 入门与使用相关推荐

  1. matlab 写入 MYSQL_阿里开源MySQL中间件Canal快速入门

    前言 距离上一篇文章发布又过去了两周,这次先填掉上一篇秒杀系统文章结尾处开的坑,介绍一下数据库中间件Canal的使用. 「Canal用途很广,并且上手非常简单,小伙伴们在平时完成公司的需求时,很有可能 ...

  2. Java入门培训班怎么选择

    想要学习java技术,小编一直给小伙伴推荐的是报班学习,目前市面上的java培训机构有很多,对于java培训班的选择很多小伙伴都比较迷茫,下面小编就为大家详细的介绍一下Java入门培训班怎么选择的问题 ...

  3. Java入门学习注意事项有哪些?

    想要学好java技术,做好学习规划路线和注意事项是非常重要的,尤其是零基础学员,Java涉及到的知识点非常多,我们需要制定合理的Java学习路线图,这样会事半功倍,下面小编和大家总结一下Java入门学 ...

  4. Java实用教程笔记 Java入门

    Java入门 JDBC Java数据库连接,(Java Database Connectivity,简称JDBC)是Java语言中用来规范客户端程序如何来访问数据库的应用程序接口,提供了诸如查询和更新 ...

  5. Java入门(一):Hello World !

    前言 从今天开始,准备写Java Web开发的系列文章,毕竟自己主攻的还是Java方向,Python只是业余学习的兴趣使然,在第二技能还没有培养成熟前,做好第一技能的巩固和提高是很有必要的.从正式入行 ...

  6. 《Java入门经典(第7版)》—— 6.11 练习

    本节书摘来异步社区<Java入门经典(第7版)>一书中的第6章,第6.11节,作者:[美]Rogers Cadenhead(罗格斯 卡登海德),更多章节内容可以访问云栖社区"异步 ...

  7. [Java入门笔记] 面向对象编程基础(二):方法详解

    2019独角兽企业重金招聘Python工程师标准>>> 什么是方法? 简介 在上一篇的blog中,我们知道了方法是类中的一个组成部分,是类或对象的行为特征的抽象. 无论是从语法和功能 ...

  8. 【极客学院每日1课 】Java入门与常用技巧

    2019独角兽企业重金招聘Python工程师标准>>> Java是Android开发者必学的基础编程语言.你的基础怎么样? 遥想当年,小乔还未出嫁,小编在大学里面,啃书本,听教授在课 ...

  9. Java必备:java入门、java学习

    2019独角兽企业重金招聘Python工程师标准>>> 版权声明:本文为北京尚学堂原创文章,未经允许不得转载. 1.Java入门 1-1.Java具有那些适合在Internet环境中 ...

最新文章

  1. CISCO7200路由器MultiChannel配置介绍
  2. J2SE综合对java util的总结 一
  3. 致敬HarmonyOS不平凡的2020,热情背后还有多少期待
  4. php 如果则,如果python脚本在phpfi中运行,则导入python模块时会出错
  5. Fastdfs(1)安装之Tracker
  6. CPDA|数据分析师需要具备哪些基本功?
  7. Windows快捷键
  8. 机器学习误差计算及评估指标
  9. 源码解析zxing条码边距及总宽度计算规则,附java使用zxing生成条形码,并去除条码两边空白
  10. 数据分析专题报告范文6篇_数据分析系列篇(6):如何写好一个专题的分析报告...
  11. 翟山鹰“生态宇宙”重磅首发 缔造超级共赢生态
  12. ssm框架访问数据库一直在转圈(请求)
  13. total uninstall 7(卸载清除工具) v7.00
  14. java 表格_Java创建表格实例详解
  15. JAVA面试解析(有赞一面)
  16. 【软考】【系统架构设计师】2021上午真题及答案
  17. 机器学习系列(一)—— 绪言
  18. 运筹说 第75期 | 数学家欧拉也玩跨界
  19. 【报错记录】解决华擎J3455-ITX不插显示器无法开机的问题
  20. fastjson按照ascii码排序

热门文章

  1. java知识体系介绍
  2. 【读书笔记】-《工业互联网-技术与实践》
  3. 中位数 POJ3784
  4. Android studio 写xml的不能自动补全的问题
  5. 58 非常酷的单页网站设计灵感
  6. Win10s分屏设置
  7. php 截取取最后一个字符
  8. 要想增加流量需要做的几点,淘宝运营新手必看的免费流量小知识
  9. CREO:CREO软件之工程图界面的【创建】、【布局】、【表】、【注释】的简介(图文教程)之详细攻略
  10. C语言中阶第三篇:循环语句do while透析以及循环语句总结(执行次数、执行特点和循环英文的详解)