在介绍mysql的多版本并发控制mvcc的过程中,我们提到过mysql中存在一些隐藏列,例如行标识事务ID回滚指针等,不知道大家是否和我一样好奇过,要怎样才能实际地看到这些隐藏列的值呢?

本文我们就来重点讨论一下诸多隐藏列中的行标识DB_ROW_ID,实际上,将行标识称为隐藏并不准确,因为它并不是一个真实存在的列,DB_ROW_ID实际上是一个非空唯一列的别名。在拨开它的神秘面纱之前,我们看一下官方文档的说明:

If a table has a PRIMARY KEY or UNIQUE NOT NULL index that consists of a single column that has an integer type, you can use _rowid to refer to the indexed column in SELECT statements

简单翻译一下,如果在表中存在主键或非空唯一索引,并且仅由一个整数类型的列构成,那么就可以使用SELECT语句直接查询_rowid,并且这个_rowid的值会引用该索引列的值。

着重看一下文档中提到的几个关键字,主键唯一索引非空单独一列数值类型,接下来我们就要从这些角度入手,探究一下神秘的隐藏字段_rowid

1、存在主键

先看设置了主键且是数值类型的情况,使用下面的语句建表:

CREATE TABLE `table1` (`id` bigint(20) NOT NULL PRIMARY KEY ,`name` varchar(32) DEFAULT NULL
) ENGINE=InnoDB;

插入三条测试数据后,执行下面的查询语句,在select查询语句中直接查询_rowid

select *,_rowid from table1

查看执行结果,_rowid可以被正常查询:

可以看到在设置了主键,并且主键字段是数值类型的情况下,_rowid直接引用了主键字段的值。对于这种可以被select语句查询到的的情况,可以将其称为显式rowid

回顾一下前面提到的文档中的几个关键字,分别对其进行分析。由于主键必定是非空字段,下面来看一下主键是非数值类型字段的情况,建表如下:

CREATE TABLE `table2` (`id` varchar(20) NOT NULL PRIMARY KEY ,`name` varchar(32) DEFAULT NULL
) ENGINE=InnoDB;

table2执行上面相同的查询,结果报错无法查询_rowid,也就证明了如果主键字段是非数值类型,那么将无法直接查询_rowid

2、无主键,存在唯一索引

上面对两种类型的主键进行了测试后,接下来我们看一下当表中没有主键、但存在唯一索引的情况。首先测试非空唯一索引加在数值类型字段的情况,建表如下:

CREATE TABLE `table3` (`id` bigint(20) NOT NULL UNIQUE KEY,`name` varchar(32)
) ENGINE=InnoDB;

查询可以正常执行,并且_rowid引用了唯一索引所在列的值:

唯一索引与主键不同的是,唯一索引所在的字段可以为NULL。在上面的table3中,在唯一索引所在的列上添加了NOT NULL非空约束,如果我们把这个非空约束删除掉,还能显式地查询到_rowid吗?下面再创建一个表,不同是在唯一索引所在的列上,不添加非空约束:

CREATE TABLE `table4` (`id` bigint(20) UNIQUE KEY,`name` varchar(32)
) ENGINE=InnoDB;

执行查询语句,在这种情况下,无法显式地查询到_rowid

和主键类似的,我们再对唯一索引被加在非数值类型的字段的情况进行测试。下面在建表时将唯一索引添加在字符类型的字段上,并添加非空约束:

CREATE TABLE `table5` (`id` bigint(20),`name` varchar(32) NOT NULL UNIQUE KEY
) ENGINE=InnoDB;

同样无法显示的查询到_rowid

针对上面三种情况的测试结果,可以得出结论,当没有主键、但存在唯一索引的情况下,只有该唯一索引被添加在数值类型的字段上,且该字段添加了非空约束时,才能够显式地查询到_rowid,并且_rowid引用了这个唯一索引字段的值。

3、存在联合主键或联合唯一索引

在上面的测试中,我们都是将主键或唯一索引作用在单独的一列上,那么如果使用了联合主键或联合唯一索引时,结果会如何呢?还是先看一下官方文档中的说明:

_rowid refers to the PRIMARY KEY column if there is a PRIMARY KEY consisting of a single integer column. If there is a PRIMARY KEY but it does not consist of a single integer column, _rowid cannot be used.

简单来说就是,如果主键存在、且仅由数值类型的一列构成,那么_rowid的值会引用主键。如果主键是由多列构成,那么_rowid将不可用。

根据这一描述,我们测试一下联合主键的情况,下面将两列数值类型字段作为联合主键建表:

CREATE TABLE `table6` (`id` bigint(20) NOT NULL,`no` bigint(20) NOT NULL,`name` varchar(32),PRIMARY KEY(`id`,`no`)
) ENGINE=InnoDB;

执行结果无法显示的查询到_rowid

同样,这一理论也可以作用于唯一索引,如果非空唯一索引不是由单独一列构成,那么也无法直接查询得到_rowid。这一测试过程省略,有兴趣的小伙伴可以自己动手试试。

4、存在多个唯一索引

在mysql中,每张表只能存在一个主键,但是可以存在多个唯一索引。那么如果同时存在多个符合规则的唯一索引,会引用哪个作为_rowid的值呢?老规矩,还是看官方文档的解答:

Otherwise, _rowid refers to the column in the first UNIQUE NOT NULL index if that index consists of a single integer column. If the first UNIQUE NOT NULL index does not consist of a single integer column, _rowid cannot be used.

简单翻译一下,如果表中的第一个非空唯一索引仅由一个整数类型字段构成,那么_rowid会引用这个字段的值。否则,如果第一个非空唯一索引不满足这种情况,那么_rowid将不可用。

在下面的表中,创建两个都符合规则的唯一索引:

CREATE TABLE `table8_2` (`id` bigint(20) NOT NULL,`no` bigint(20) NOT NULL,`name` varchar(32),UNIQUE KEY(no),UNIQUE KEY(id)
) ENGINE=InnoDB;

看一下执行查询语句的结果:

可以看到_rowid的值与no这一列的值相同,证明了_rowid会严格地选取第一个创建的唯一索引作为它的引用。

那么,如果表中创建的第一个唯一索引不符合_rowid的引用规则,第二个唯一索引满足规则,这种情况下,_rowid可以被显示地查询吗?针对这种情况我们建表如下,表中的第一个索引是联合唯一索引,第二个索引才是单列的唯一索引情况,再来进行一下测试:

CREATE TABLE `table9` (`id` bigint(20) NOT NULL,`no` bigint(20) NOT NULL,`name` varchar(32),UNIQUE KEY `index1`(`id`,`no`),UNIQUE KEY `index2`(`id`)
) ENGINE=InnoDB;

进行查询,可以看到虽然存在一个单列的非空唯一索引,但是因为顺序选取的第一个不满足要求,因此仍然不能直接查询_rowid

如果将上面创建唯一索引的语句顺序调换,那么将可以正常显式的查询到_rowid

5、同时存在主键与唯一索引

从上面的例子中,可以看到唯一索引的定义顺序会决定将哪一个索引应用_rowid,那么当同时存在主键和唯一索引时,定义顺序会对其引用造成影响吗?

按照下面的语句创建两个表,只有创建主键和唯一索引的顺序不同:

CREATE TABLE `table11` (`id` bigint(20) NOT NULL,`no` bigint(20) NOT NULL,PRIMARY KEY(id),UNIQUE KEY(no)
) ENGINE=InnoDB;CREATE TABLE `table12` (`id` bigint(20) NOT NULL,`no` bigint(20) NOT NULL,UNIQUE KEY(id),PRIMARY KEY(no)
) ENGINE=InnoDB;

查看运行结果:

可以得出结论,当同时存在符合条件的主键和唯一索引时,无论创建顺序如何,_rowid都会优先引用主键字段的值。

6、无符合条件的主键与唯一索引

上面,我们把能够直接通过select语句查询到的称为显式的_rowid,在其他情况下虽然_rowid不能被显式查询,但是它也是一直存在的,这种情况我们可以将其称为隐式的_rowid

实际上,innoDB在没有默认主键的情况下会生成一个6字节长度的无符号数作为自动增长的_rowid,因此最大为2^48-1,到达最大值后会从0开始计算。下面,我们创建一个没有主键与唯一索引的表,在这张表的基础上,探究一下隐式的_rowid

CREATE TABLE `table10` (`id` bigint(20),`name` varchar(32)
) ENGINE=InnoDB;

首先,我们需要先查找到mysql的进程pid

ps -ef | grep mysqld

可以看到,mysql的进程pid是2068:

在开始动手前,还需要做一点铺垫, 在innoDB中其实维护了一个全局变量dictsys.row_id,没有定义主键的表都会共享使用这个row_id,在插入数据时会把这个全局row_id当作自己的主键,然后再将这个全局变量加 1。

接下来我们需要用到gdb调试的相关技术,gdb是一个在Linux下的调试工具,可以用来调试可执行文件。在服务器上,先通过yum install gdb安装,安装完成后,通过下面的gdb命令 把 row_id 修改为 1:

gdb -p 2068 -ex 'p dict_sys->row_id=1' -batch

命令执行结果:

在空表中插入3行数据:

INSERT INTO table10 VALUES (100000001, 'Hydra');
INSERT INTO table10 VALUES (100000002, 'Trunks');
INSERT INTO table10 VALUES (100000003, 'Susan');

查看表中的数据,此时对应的_rowid理论上是1~3:

然后通过gdb命令把row_id改为最大值2^48,此时已超过dictsys.row_id最大值:

gdb -p 2068 -ex 'p dict_sys->row_id=281474976710656' -batch

命令执行结果:

再向表中插入三条数据:

INSERT INTO table10 VALUES (100000004, 'King');
INSERT INTO table10 VALUES (100000005, 'Queen');
INSERT INTO table10 VALUES (100000006, 'Jack');

查看表中的全部数据,可以看到第一次插入的三条数据中,有两条数据被覆盖了:

为什么会出现数据覆盖的情况呢,我们对这一结果进行分析。首先,在第一次插入数据前_rowid为1,插入的三条数据对应的_rowid为1、2、3。如下图所示:

当手动设置_rowid为最大值后,下一次插入数据时,插入的_rowid重新从0开始,因此第二次插入的三条数据的_rowid应该为0、1、2。这时准备被插入的数据如下所示:

当出现相同_rowid的情况下,新插入的数据会根据_rowid覆盖掉原有的数据,过程如图所示:

所以当表中的主键或唯一索引不满足我们前面提到的要求时,innoDB使用的隐式的_rowid是存在一定风险的,虽然说2^48这个值很大,但还是有可能被用尽的,当_rowid用尽后,之前的记录就会被覆盖。从这一角度也可以提醒大家,在建表时一定要创建主键,否则就有可能发生数据的覆盖。

本文基于mysql 5.7.31 进行测试

官方文档:https://dev.mysql.com/doc/refman/5.7/en/create-index.html

欢迎关注公众号【码农参上】,回复关键字“面试”、“架构”获取电子书资料

眼见为实,看看MySQL中的隐藏列相关推荐

  1. 眼见为实,来瞧瞧MySQL中的隐藏列!

    在介绍mysql的多版本并发控制MVCC的过程中,我们提到过mysql中存在一些隐藏列,例如行标识.事务ID.回滚指针等,不知道大家是否和我一样好奇过,要怎样才能实际地看到这些隐藏列的值呢? 本文我们 ...

  2. MySQL中的隐藏列!_rowid

    在介绍mysql的多版本并发控制 MVCC 的过程中,我们提到过mysql中存在一些隐藏列,例如 行标识. 事务ID. 回滚指针等,不知道大家是否和我一样好奇过,要怎样才能实际地看到这些隐藏列的值呢? ...

  3. mysql 临时列_如何在MySQL中列出临时表列?

    要列出MySQL中的临时表列,让我们首先创建一个临时表. 这是一个例子.我们创建了一个临时表,其中包含一些列,其中包括学生的详细信息-mysql> CREATE TEMPORARY TABLE  ...

  4. 在MySQL中的特定列之后添加多个列

    本文翻译自:Adding multiple columns AFTER a specific column in MySQL I need to add multiple columns to a t ...

  5. MySql中关于某列中相同数值连续出现次数的统计

    MySql中关于某列中相同数值连续出现次数的统计 原表如下: www.2cto.com 100 101 102 100 100 103 104 102 102 105 106 101 101 输出如下 ...

  6. 报表中利用隐藏列对扩展格显示值求和

    在润乾报表中,获取报表中单元格显示值的函数是disp(),然而这个函数却无法计算扩展单元格的显示值.从而无法直接对扩展个显示值求和. 在下图中,需要计算D3单元格的显示值之和. D3值为:ds1.再订 ...

  7. html中怎样隐藏列,关于jquery:隐藏/显示HTML表中的列

    我有一个包含几列的HTML表,我需要使用jquery实现一个列选择器. 当用户单击复选框时,我要隐藏/显示表中的相应列. 我想在不将类附加到表中的每个td的情况下执行此操作,是否可以使用jquery选 ...

  8. 如何选择MySQL中除一列外的所有列

    SQL通过SELECT *(SELECT ALL)子句使选择表中的所有字段变得非常简单.不幸的是,一旦您从列表中删除了一列,SELECT ALL语句就会消失.写出每个列的名称很快就会变得乏味,尤其是当 ...

  9. nvarchar在mysql中是_如何在MySQL中创建NVARCHAR列?

    MySQL转换NVARCHAR()为VARCHAR().NVARCHAR在MySQL中代表National Varchar.让我们首先创建一个表,其中" StudentName"列 ...

最新文章

  1. 树莓派基于 Linux 的 Windows XP 现已可用
  2. 百篇大计敬本年之系统篇《八》—— Ubuntu16.04 挂载windows的 NTFS 文件系统时错误的解决方法...
  3. 卓讯企业名录搜索软件_还在用卓讯企业名录搜索软件吗?探迹黑科技助力企业提升销售效率...
  4. Python-OpenCV 处理图像(六)(七)(八):对象识别 图像灰度化处理 图像二值化处理
  5. Java编码约定被认为是有害的
  6. ACM基础与精选2018
  7. 从零开始的泡泡龙游戏
  8. Android动态破解微信本地数据库(EnMicroMsg.db)
  9. 计算机启动太慢的原因是,电脑启动慢的原因分析
  10. 【MATLAB】通信信号调制通用函数 — 傅里叶逆变换
  11. 关于Linux下面移动硬盘读不出来
  12. 使用Python发送邮件(QQ邮箱为例)
  13. 体寒是不是天生的 体寒四个基本常识须知
  14. 无法与域“xxxx.com”的Active Directory域控制器(AD DC)连接 之DNS故障
  15. CST微波工作室学习笔记—17.CST和HFSS联合导入、导出模型+仿真
  16. 市面上主流的音视频竞品分析对比
  17. 基于spi接口的oled屏Android服务框架
  18. 用仿ActionScript的语法来编写html5——第二篇,利用Sprite来实现动画
  19. 华为 CE系列交换机配置radius认证
  20. KTV「消亡史」:辉煌、挫折与新生

热门文章

  1. biopython----bio.PDB
  2. protal服务器获取不到设备信息,Poral网页认证提示portal服务器获取不到设备信息或者设备没有回应req_info报文的解决办法...
  3. 手机的开发者选项怎么找(真机调试)
  4. log4j配置详解(非常详细转载)
  5. 操作系统磁盘调度算法
  6. 养生秘方,专治各种小毛病,千万别弄丢了!
  7. python把字典保存到文件_将Python字典保存到文件中,并定期更新它
  8. Errors集锦-数据库-file /usr/share/mysql/czech/errmsg.sys from install of mysql-community-common-5.7.16-1.
  9. js 验证码错误,输入框获得焦点并清除内容
  10. 零基础学C语言(第一天)