导读

  • 在开发中一定会用到统计一张表的行数,比如一个交易系统,老板会让你每天生成一个报表,这些统计信息少不了sql中的count函数。
  • 但是随着记录越来越多,查询的速度会越来越慢,为什么会这样呢?Mysql内部到底是怎么处理的?
  • 今天这篇文章将从Mysql内部对于count函数是怎样处理的来展开详细的讲述。

count的实现方式

  • 在Mysql中的不同的存储引擎对count函数有不同的实现方式。
  • MyISAM引擎把一个表的总行数存在了磁盘上,因此执行count(*)的时候会直接返回这个数,效率很高(没有where查询条件)。
  • InnoDB引擎并没有直接将总数存在磁盘上,在执行count(*)函数的时候需要一行一行的将数据读出来,然后累计总数。

为什么InnoDB不将总数存起来?

  • 说到InnoDB相信读者总会想到其支持事务的特性,事务具有隔离性,如果将总数存起来,怎么保证各个事务之间的总数的一致性呢?不明白的看下图:
  • 事务A事务B中的count(*)的执行结果是不同的,因此InnoDB引擎在每个事务中返回多少行是不确定的,只能一行一行的读出来用来判断总数。

如何提升count效率

  • InnoDB对于如何提升count(*)的查询效率,网上有多种解决办法,这里主要介绍三种,并分析可行性。

show table status

  • show table status这个命令能够很快的查询出数据库中每个表的行数,但是真的能够替代count(*)吗?
  • 答案是不能。原因很简单,这个命令统计出来的值是一个「估值」,因此是不准确的,官方文档说误差大概在40%-50%
  • 因此这种方法直接pass,不准确还用它干嘛。

缓存系统存储总数

  • 这种方法也是最容易想到的,增加一行就+1,删除一行就-1,并且缓存系统读取也是很快,既简单又方便的为什么不用?
  • 缓存系统和Mysql是两个系统,比如redisMysql这两个是典型的比较。两个系统最难的就是在高并发下无法保证数据的一致性。通过以下两图我们来理解一下:
  • 通过上面两张图,无论是redis计数+1还是insert into user先执行,最终都会导致数据在逻辑上的不一致。第一张图会出现redis计数少了,第二张图虽然计数正确了但是并没有查询出插入的那一行数据。
  • 在并发系统里面,我们是无法精确控制不同线程的执行时刻的,因为存在图中的这种操作序列,所以,我们说即使Redis正常工作,这个计数值还是逻辑上不精确的。

在数据库保存计数

  • 通过缓存系统保存的分析得知了使用缓存无法保证数据在逻辑上的一致性,因此我们想到了直接使用数据库来保存,有了「事务」的支持,也就保证了数据的一致性了。
  • 如何使用呢?很简单,直接将计数保存在一张表中(table_name,total)。
  • 至于执行的逻辑只需要将缓存系统中redis计数+1改成total字段+1即可,如下图:
  • 由于在同一个事务中,保证了数据在逻辑上的一致性。

不同count的用法

  • count()是一个聚合函数,对于返回的结果集,一行行地判断,如果count函数的参数不是NULL,累计值就加1,否则不加。最后返回累计值。
  • count的用法有多种,分别是count(*)、count(字段)、count(1)、count(主键id)。那么多种用法,到底有什么差别呢?当然,「前提是没有where条件语句」。
  • count(id):InnoDB引擎会遍历整张表,把每一行的id值都取出来,返回给server层。server层拿到id后,判断是不可能为空的,就按行累加。
  • count(1):InnoDB引擎遍历整张表,但不取值。server层对于返回的每一行,放一个数字1进去,判断是不可能为空的,按行累加。
  • count(字段):
  • 如果这个“字段”是定义为not null的话,一行行地从记录里面读出这个字段,判断不能为null,按行累加;
  • 如果这个字段定义允许为null,那么执行的时候,判断到有可能是null,还要把值取出来再判断一下,不是null才累加。
  • count(*):不会把全部字段取出来,而是专门做了优化,不取值。count(*)肯定不是null,按行累加。
  • 所以结论很简单:「按照效率排序的话,count(字段)<count(主键id)<count(1)≈count(*),所以建议读者,尽量使用count(*)。」
  • 「注意」:这里肯定有人会问,count(id)不是走的索引吗,为什么查询效率和其他的差不多呢?陈某在这里解释一下,虽然走的索引,但是还是要一行一行的扫描才能统计出来总数。

总结

  • MyISAM表虽然count(*)很快,但是不支持事务;
  • show table status命令虽然返回很快,但是不准确;
  • InnoDB直接count(*)会遍历全表(没有where条件),虽然结果准确,但会导致性能问题。
  • 缓存系统的存储计数虽然简单效率高,但是无法保证数据的一致性。
  • 数据库保存计数很简单,也能保证数据的一致性,建议使用。

dbgrideh 为什么只一行_Mysql性能优化:为什么count(*)这么慢?相关推荐

  1. mysql属性配置提高查询_MYSQL性能优化-安装时优化参数配置提高服务性能

    MYSQL性能优化一直是个头痛的问题,目前大多都是直接把页面html静态页面或直接使用了缓存技术,下面我就mysql本身的性能优化来分享一下. 安装时优化参数配置提高服务性能 在Linux下安装Mys ...

  2. mysql not in优化_MySQL性能优化 — 实践篇2

    点赞再看,养成习惯,微信搜一搜[一角钱小助手]关注更多原创技术文章.本文 GitHub org_hejianhui/JavaStudy 已收录,有我的系列文章. 前言 MySQL索引底层数据结构与算法 ...

  3. mysql 非自然月统计_MySQL性能优化 — 实践篇1

    点赞再看,养成习惯,微信搜一搜[一角钱小助手]关注更多原创技术文章. 本文 GitHub org_hejianhui/JavaStudy 已收录,有我的系列文章. 前言 MySQL索引底层数据结构与算 ...

  4. distinct性能问题_Mysql性能优化:如何给字符串加索引?

    导读 现代大部分的登录系统都支持邮箱.手机号码登录两种方式,那么如何在邮箱或者手机号码这个字符串上建立索引才能保证性能最佳呢? 今天这篇文章就来探讨一下在Mysql中如何给一个字符串加索引才能达到性能 ...

  5. Mysql删除语句优化_MySQL性能优化之常用SQL语句优化

    SQL性能优化的目标:至少要达到range级别,要求是ref级别,consts最高.[阿里巴巴JAVA开发手册] 说明: 1).consts单表中最多只有一个匹配行(主键/唯一索引),在优化阶段即可读 ...

  6. mysql锁与性能_MySQL性能优化--锁(概念)

    < MySQL性能优化--锁>首发牧码人博客转发请加此提示 MySQL基本概念--锁 介绍下对于MySQL锁机制的理解 从基本概念开始: 共享锁 共享锁的代号是S,是Share的缩写,共享 ...

  7. mysql 按日期拆分成多条记录_mysql性能优化2 设计规范 设计原则 结构优化 拆分 配置优化...

    一.MYSQL数据库设计规范 1.数据库命名规范 a.采用26个英文字母(区分大小写)和0-9的自然数(经常不需要)加上下划线'_'组成; b.命名简洁明确(长度不能超过30个字符); c.例如:us ...

  8. mysql 中间表 性能_mysql性能优化

    性能优化 myql数据库优化的原则: 1.减少系统的瓶颈. 2.减少资源的占用. 3.增加系统的反应速度. 优化查询 1.索引对查询的影响 比如有一个表student表,有id.name.sex.no ...

  9. mysql 慢查询优化_MySQL 性能优化之慢查询

    性能优化的思路 首先需要使用慢查询功能,去获取所有查询时间比较长的SQL语句 其次使用explain命令去查询由问题的SQL的执行计划(脑补链接:点我直达1,点我直达2) 最后可以使用show pro ...

最新文章

  1. 蓝桥杯最短路(java过)spfa单源最短路算法
  2. Python的线程/进程间通讯对象分析
  3. php中退出怎么写,php中退出登录怎么写
  4. java 1000以内的完数
  5. flat在java中的含义_Java 9中Collectors.flatMapping()方法的重要性?
  6. Oracle数据的导出与导入
  7. 安卓模拟器切换横屏之后怎么返回竖屏
  8. 在C#中引入延迟计算和公平调度
  9. 输入两个整数序列,第一个序列表示栈的压入顺序,请判断第二个序列是否可能为该栈的弹出顺序。...
  10. 123457123457#0#----com.MC.konglongtianse222----前拼后广--恐龙填色mc-mc1111
  11. 【树莓派】利用tesseract进行汉字识别
  12. 银联在线java接口开发_银联在线Java接口开发
  13. 印度体育教育初创公司 KOOH Sports 获得 220 万美元风险投资
  14. vmware 设置ip
  15. Kafka的监控以及运维与Kafka-eagle的安装
  16. iOS 开发者必知的 75 个工具
  17. window创建l2tp
  18. R语言学习记录之安装caret包与jupyter关联R内核
  19. CSS 3种渐变效果(线性渐变,径向渐变,圆锥型渐变)
  20. 《软件设计的哲学》(十九)【代码应该是显而易见的】

热门文章

  1. 安装redis,执行make test时遇到You need tcl 8.5 or newer in order to run the Redis test
  2. 如何写一个bat批处理自动上传文件到FTP
  3. java des加密类_java的DES加密解密辅助类
  4. Android 上滑背景变淡,在Android中,如何平滑地将背景从一种颜色淡化到另一种颜色? (如何使用线程)...
  5. 51单片机雾化片自动扫频程序_单片机简介
  6. QtCreate不能使用代码提示功能
  7. BugkuCTF-WEB题你从哪里来
  8. python怎么执行csv文件_无法读取/打开/或对CSV文件python 3.4windows执行任何操作
  9. matlab数字图像处理函数,MATLAB数字图像处理学习(二)|常用函数
  10. java类spring加载_spring的加载机制?