原创作者:图解MySQL

在上一期图解 图解MySQL | MySQL DDL为什么成本高?中,我们介绍了:

  • 传统情况下,为表添加列需要对表进行重建
  • 腾讯团队为 MySQL 引入了 Instant Add Column 的方案(以下称为 "立刻加列" 功能)可以快速完成 为表添加列 的任务

同时我们留了以下思考题:

  • "立刻加列" 是如何工作的 ?
  • 所谓 "立刻加列" 是否完全不影响业务,是否是真正的 "立刻" 完成 ?

本期我们针对这几个问题来进行讨论:

传统情况

我们先回顾一下,在没有 "立刻加列" 功能时,加列操作是怎么完成的。我们也借此来熟悉一下本期的图例:

  • 当进行 加列操作 时,所有的数据行 都必须要 增加一段数据(图中的 列 4 数据)
  • 如上一期图解所讲,当改变数据行的长度,就需要 重建表空间(图中灰蓝的部分为发生变更的部分)
  • 数据字典中的列定义也会被更新

以上操作的问题在于 每次加列 操作都需要重建表空间,这就需要大量 IO以及大量的时间


立刻加列

"立刻加列" 的过程如下图:

  • "立刻加列" 时,只会变更数据字典中的内容,包括:
  • 列定义中增加 新列的定义
  • 增加 新列的默认值
  • "立刻加列" 后,当要读取表中的数据时:
  • 由于 "立刻加列" 没有 变更行数据,读取的行数据只有 3 列
  • MySQL 会将 新增的第 4 列的默认值,追加到 读取的数据后

以上过程描述了 如何读取 在 "立刻加列" 之前写入的数据,其实质是:在读取数据的过程中,"伪造" 了一个新列出来

那么如何读取 在 "立刻加列" 之后 写入的数据呢 ? 过程如下图:

当读取 行 4 时:

  • 通过判断 数据行的头信息中的instant 标志位,可以知道该行的格式是 "新格式":该行头信息后有一个新字段 "列数"
  • 通过读取 数据行的 "列数" 字段,可以知道 该行数据中多少列有 "真实" 的数据,从而按列数读取数据

通过上图可以看到:读取 在"立刻加列" 前/后写入的数据是不同的流程

通过以上的讨论,我们可以总结 "立刻加列" 之所以高效的原因是:

  1. 在执行 "立刻加列" 时,不变更数据行的结构
  2. 读取 "旧" 数据时,"伪造" 新增的列,使结果正确
  3. 写入 "新" 数据时,使用了新的数据格式(增加了instant标志位 和 "列数" 字段),以区分新旧数据
  4. 读取 "新" 数据时,可以如实读取数据

那么 我们是否能一直 "伪造" 下去 ? "伪造" 何时会被拆穿 ?

考虑以下场景:

  1. 用 "立刻加列" 增加列 A
  2. 写入数据行 1
  3. 用 "立刻加列" 增加列 B
  4. 写入数据行 2
  5. 删除列 B

我们推测一下 "删除列 B" 的最小代价:需要修改 数据行中的instant标志位或 "列数" 字段,这至少会影响到 "立刻加列" 之后写入的数据行,成本类似于重建数据

从以上推测可知:当出现 与 "立刻加列" 操作不兼容 的 DDL 操作时,数据表需要进行重建,如下图所示:

扩展思考题:是否能设计其他的数据格式,取代instant标志位和 "列数" 字段,使得 加列/删列 操作都能 "立刻完成" ?(提示:考虑 加列 - 删列 - 再加列 的情况)


使用限制

在了解原理之后,我们来看看 "立刻加列" 的使用限制,就很容易能理解其中的前两项:

  1. "立刻加列" 的加列位置只能在表的最后,而不能加在其他列之间
  2. 在元数据中,只记录了 数据行 应有多少列,而没有记录 这些列 应出现的位置。所以无法实现指定列的位置
  3. "立刻加列" 不能添加主键列
  4. 加列 不能涉及聚簇索引的变更,否则就变成了 "重建" 操作,不是 "立刻" 完成了
  5. "立刻加列"不支持压缩的表格式
  6. 按照 WL 的说法:"COMPRESSED is no need to supported"(没必要支持不怎么用的格式)

总结回顾

我们总结一下上面的讨论:

  1. "立刻加列" 之所以高效的原因是:
  2. 在执行 "立刻加列" 时,不变更数据行的结构
  3. 读取 "旧" 数据时,"伪造" 新增的列,使结果正确
  4. 写入 "新" 数据时,使用了新的数据格式 (增加了 instant 标志位 和 "列数" 字段),以区分新旧数据
  5. 读取 "新" 数据时,可以如实读取数据
  6. "立刻加列" 的 "伪造" 手法,不能一直维持下去。当发生 与 "立刻加列" 操作不兼容 的 DDL 时,表数据就会发生重建

回到之前遗留的两个问题:

  • "立刻加列" 是如何工作的 ?
  • 我们已经解答了这个问题
  • 所谓 "立刻加列" 是否完全不影响业务,是否是真正的 "立刻" 完成 ?
  • 可以看到:就算是 "立刻加列",也需要变更 数据字典,那么 该上的锁还是逃不掉的。也就是说 这里的 "立刻" 指的是 "不变更数据行的结构",而并非指 "零成本地完成任务"

本期仍然留下一个思考题:

  • 本文中描述了 在 "立刻加列" 之后 插入 数据行的情况 (数据行会使用新格式)。那么在 "立刻加列" 之后 更新 数据行会发生什么情况呢 ?

mysql新增列并同时增加数据_图解MySQL | 「原理解析」 MySQL 为表添加列 是怎么立刻完成的...相关推荐

  1. mysql新增列并同时增加数据_图解MySQL | [原理解析] MySQL 为表添加列 是怎么quot;立刻quot;完成的...

    在上一期图解 图解MySQL | MySQL DDL为什么成本高?中,我们介绍了: 传统情况下,为表添加列需要对表进行重建 腾讯团队为 MySQL 引入了 Instant Add Column 的方案 ...

  2. mysql数据丢失_图解MySQL | 「原理解析」 MySQL使用固定的server_id导致数据丢失

    原创作者:爱可生开源社区 本文我们来看一个场景,两台MySQL实例使用主从复制,当master故障,触发高可用切换,新master上线后,通过备份重建旧master并建立复制后,数据发生丢失. 以下我 ...

  3. mysql内连接运算量会增加多少_新年手打,40道经典MYSQL面试干货,速来收藏

    MySQL 面试题 1.MySQL 中有哪几种锁? 1.表级锁:开销小,加锁快:不会出现死锁:锁定粒度大,发生锁冲突的概率最 高,并发度最低. 2.行级锁:开销大,加锁慢:会出现死锁:锁定粒度最小,发 ...

  4. mysql新增字段位置_图解MySQL | [原理解析] MySQL 为表添加列 是怎么quot;立刻quot;完成的...

    在上一期图解 图解MySQL | MySQL DDL为什么成本高?中,我们介绍了: 传统情况下,为表添加列需要对表进行重建 腾讯团队为 MySQL 引入了 Instant Add Column 的方案 ...

  5. mysql数据表添加列_如何将列添加到MySQL表

    mysql数据表添加列 The command add column is used to add an additional column to any given MySQL table. 命令a ...

  6. mysql 增加列和注释_MySql给表添加列和注释

    1.给表添加列 alter table supplier_seller add column company_id int null comment '供应主体id'; 默认情况下,添加的列会添加到最 ...

  7. mysql 自增 不是主键_程序员经典面试题,MySQL自增主键为什么不连续

    在我们日常使用Mysql中,如果不是特殊的业务需要,一般我们都会使用自增主键,自增主键的好处可以在插入的时候尽量地减少页分割,增加Mysql的写入效率.我们有时候就会发现,自增主键并不是连续递增的,为 ...

  8. [免费专栏] Android安全之数据存储与数据安全「详解」

    也许每个人出生的时候都以为这世界都是为他一个人而存在的,当他发现自己错的时候,他便开始长大 少走了弯路,也就错过了风景,无论如何,感谢经历 Android安全付费专栏长期更新,本篇最新内容请前往: [ ...

  9. 「Excel技巧」Excel中根据某列的值去汇总另外一列的值

    「Excel技巧」Excel中根据某列的值去汇总另外一列的值 在Excel表格中输入数据,需要根据component列的值分别汇总July列的值. 1.选中单元格区域并点击"insert&q ...

最新文章

  1. mysql 数据库连接字符串,mysql基本语句和连接字符串_数据库技巧
  2. SQL Server开发人员应聘常见问题妙解
  3. 多网卡指定网卡发送数据
  4. 对比解读《2020年CNCF中国云原生调查报告》
  5. python numpy np.array_Python | numpy | np.split()与np.array_split()函数
  6. no applicable action for [springProfile], current ElementPath is [[configuration][springProfile]]
  7. MYSQL安装与库的基本操作
  8. 北斗形变监测系统_一款基于北斗卫星定位边坡表面位移监测系统
  9. 广东省的盆友们,这波退税及时雨你赶上了吗?
  10. springboot jvm参数
  11. 数字逻辑_逻辑函数化简(配项法)例子
  12. oracle 模糊查询语法
  13. 虚拟机vmware设置nat模式上网
  14. Ps快捷键及基础知识
  15. 当我们谈注册中心时我们谈什么
  16. DMB DSB和ISB区别
  17. 淘客渠道商备案及流程说明
  18. Instruments使用技巧
  19. Chapter 1 复杂度分析和递归分析
  20. 一次zabbix连接不上mysql数据库的经历

热门文章

  1. oracle创建数据库表空间
  2. 面向对象(基础oop)之继承总结
  3. 将一副图片编译进uboot
  4. Android 长度单位
  5. C语言decompose函数,R语言使用decompose函数进行时间序列的波动趋势分解
  6. java 取余_JAVA面试解析(有赞)
  7. 删除同域名所有cookies_Namesilo域名解析DNS设置教程
  8. 加载geojson面数据_地理数据可视化
  9. ae在哪里直接复制合成_AE模板里修改复制的合成如何不影响原先的合成?
  10. datax 高级_GitHub - HeyTool/DataX