无论是对于哪一种数据库来说,缓存技术都是提高数据库性能的关键技术,物理磁盘的访问速度永 远都会与内存的访问速度永远都不是一个数量级的。通过缓存技术无论是在读还是写方面都可以大大提 高数据库整体性能。

Innodb_buffer_pool_size 的合理设置

Innodb 存储引擎的缓存机制和 MyISAM

的最大区别就在于 Innodb 不仅仅缓存索引,同时还会缓存实 际的数据。所以,完全相同的数据库,使用 Innodb

存储引擎可以使用更多的内存来缓存数据库相关的信 息,当然前提是要有足够的物理内存。这对于在现在这个内存价格不断降低的时代,无疑是个很吸引人

的特性。

innodb_buffer_pool_size

参数用来设置 Innodb 最主要的 Buffer(Innodb_Buffer_Pool)的大小,也

就是缓存用户表及索引数据的最主要缓存空间,对 Innodb 整体性能影响也最大。无论是 MySQL 官方手册 还是网络上很多人所分享的

Innodb 优化建议,都简单的建议将 Innodb 的 Buffer  Pool 设置为整个系统 物理内存的 50%  ~ 80%

之间。如此轻率的给出此类建议,我个人觉得实在是有些不妥。

不管是多么简单的参数,都可能与实际运行场景有很大

的关系。完全相同的设置,不同的场景下的 表现可能相差很大。就从 Innodb 的 Buffer  Pool

到底该设置多大这个问题来看,我们首先需要确定的是 这台主机是不是就只提供 MySQL 服务?MySQL 需要提供的的最大连接数是多少?MySQL

中是否还有 MyISAM 等其他存储引擎提供服务?如果有,其他存储引擎所需要使用的 Cache 需要多大?

假设是一台单独给 MySQL 使用的主机,物理内存总大小为 8G,MySQL 最大连接数为 500,同时还使用 了 MyISAM 存储引擎,这时候我们的整体内存该如何分配呢?

内存分配为如下几大部分:

a)     系统使用,假设预留 800M;

b)     线程独享,约 2GB  = 500

* (1MB  + 1MB  + 1MB  + 512KB  + 512KB),组成大概如下:sort_buffer_size:1MB

join_buffer_size:1MB read_buffer_size:1MB read_rnd_buffer_size:512KB

thread_statck:512KB

c)    MyISAM  Key Cache,假设大概为 1.5GB;

d)     Innodb Buffer  Pool 最大可用量:8GB  - 800MB  - 2GB  - 1.5GB = 3.7GB;

假设这个时候我们还按照

50%~80%的建议来设置,最小也是 4GB,而通过上面的估算,最大可用值 在 3.7GB

左右,那么很可能在系统负载很高当线程独享内存差不多出现极限情况的时候,系统很可能就

会出现内存不足的问题了。而且上面还仅仅只是列出了一些使用内存较大的地方,如果进一步细化,很

可能可用内存会更少。上面只是一个简单的示例分析,实际情况并不一定是这样的,这里只是希望大家了解,在设置一些

参数的时候,千万不要想当然,一定要详细的分析可能出现的情况,然后再通过不断测试调整来达到自

己所处环境的最优配置。就我个人而言,正式环境上线之初,我一般都会采取相对保守的参数配置策

略。上线之后,再根据实际情况和收集到的各种性能数据进行针对性的调整。

当系统上线之后,我们可以通过 Innodb 存储引擎提供给我们的关于 Buffer  Pool 的实时状态信息作 出进一步分析,来确定系统中 Innodb 的 Buffer  Pool 使用情况是否正常高效:

sky@localhost  : example 08:47:54> show status like  'Innodb_buffer_pool_%';

+-----------------------------------+-------+

| Variable_name    | Value |

+-----------------------------------+-------+

| Innodb_buffer_pool_pages_data     | 70    |

| Innodb_buffer_pool_pages_dirty    | 0    |

| Innodb_buffer_pool_pages_flushed | 0    |

| Innodb_buffer_pool_pages_free    | 1978    |

| Innodb_buffer_pool_pages_latched | 0    |

| Innodb_buffer_pool_pages_misc     | 0    |

| Innodb_buffer_pool_pages_total    | 2048    |

| Innodb_buffer_pool_read_ahead_rnd  | 1    |

| Innodb_buffer_pool_read_ahead_seq  | 0    |

| Innodb_buffer_pool_read_requests | 329    |

| Innodb_buffer_pool_reads    | 19    |

| Innodb_buffer_pool_wait_free    | 0    |

| Innodb_buffer_pool_write_requests | 0    |

+-----------------------------------+-------+

从上面的值我们可以看出总共 2048

pages,还有 1978 是 Free 状态的仅仅只有 70 个 page 有数据, read 请求 329 次,其中有 19

次所请求的数据在 buffer  pool 中没有,也就是说有 19 次是通过读取物理 磁盘来读取数据的,所以很容易也就得出了 Innodb

Buffer  Pool 的 Read 命中率大概在为:(329 - 19)/ 329  * 100%  =

94.22%。

当然,通过上面的数据,我们还可以分析出 write 命中率,可以得到发生了多少次 read_ahead_rnd,多少次 read_ahead_seq,发生过多少次 latch,多少次因为 Buffer 空间大小不足而产 生 wait_free 等等。

单从这里的数据来看,我们设置的 Buffer  Pool 过大,仅仅使用 70  / 2048  * 100%  = 3.4%。

在 Innodb Buffer  Pool

中,还有一个非常重要的概念,叫做“预读”。一般来说,预读概念主要是

在一些高端存储上面才会有,简单来说就是通过分析数据请求的特点来自动判断出客户在请求当前数据

块之后可能会继续请求的数据快。通过该自动判断之后,存储引擎可能就会一次将当前请求的数据库和

后面可能请求的下一个(或者几个)数据库一次全部读出,以期望通过这种方式减少磁盘 IO 次数提高 IO

性能。在上面列出的状态参数中就有两个专门针对预读:

Innodb_buffer_pool_read_ahead_rnd,记录进行随机读的时候产生的预读次数; Innodb_buffer_pool_read_ahead_seq,记录连续读的时候产生的预读次数;

innodb_log_buffer_size 参数的使用

顾名思义,这个参数就是用来设置 Innodb 的

Log Buffer 大小的,系统默认值为 1MB。Log  Buffer 的主要作用就是缓冲 Log 数据,提高写 Log 的 IO

性能。一般来说,如果你的系统不是写负载非常高且以 大事务居多的话,8MB 以内的大小就完全足够了。

我们也可以通过系统状态参数提供的性能统计数据来分析 Log 的使用情况:

sky@localhost  : example 10:11:05> show status like 'innodb_log%';

+---------------------------+-------+

| Variable_name    | Value |

+---------------------------+-------+

| Innodb_log_waits     | 0    |

| Innodb_log_write_requests | 6    |

| Innodb_log_writes     | 2    |

+---------------------------+-------+

通过这三个状态参数我们可以很清楚的看到 Log Buffer 的等待次数等性能状态。

当然,如果完全从 Log Buffer

本身来说,自然是大一些会减少更多的磁盘 IO。但是由于 Log 本身是 为了保护数据安全而产生的,而 Log 从 Buffer

到磁盘的刷新频率和控制数据安全一致的事务直接相关,

并且也有相关参数来控制(innodb_flush_log_at_trx_commit),所以关于 Log 相关的更详细的实现机

制和优化在后面的“事务优化”中再做更详细的分析,这里就不展开了。

innodb_additional_mem_pool_size 参数理解

innodb_additional_mem_pool_size

所设置的是用于存放 Innodb 的字典信息和其他一些内部结构所 需要的内存空间。所以我们的 Innodb

表越多,所需要的空间自然也就越大,系统默认值仅有 1MB。当 然,如果 Innodb

实际运行过程中出现了实际需要的内存比设置值更大的时候,Innodb 也会继续通过 OS 来申请内存空间,并且会在 MySQL

的错误日志中记录一条相应的警告信息让我们知晓。

从我个人的经验来看,一个常规的几百个

Innodb 表的 MySQL,如果不是每个表都是上百个字段的 话,20MB

内存已经足够了。当然,如果你有足够多的内存,完全可以继续增大这个值的设置。实际上,

innodb_additional_mem_pool_size 参数对系统整体性能并无太大的影响,所以只要能存放需要的数据即

可,设置超过实际所需的内存并没有太大意义,只是浪费内存而已。

Double Write Buffer

Double Write Buffer 是 Innodb 所使用的一种较为独特的文件 Flush 实现技术,主要做用是为了通 过减少文件同步次数提高 IO 性能的情况下,提高系统 Crash 或者断电情况下数据的安全性,避免写入的 数据不完整。

一般来说,Innodb

在将数据同步到数据文件进行持久化之前,首先会将需要同步的内容写入存在于表空间中的系统保留的存储空间,也就是被我们称之为 Double Write

Buffer 的地方,然后再将数据进 行文件同步。所以实质上,Double Write Buffer

中就是存放了一份需要同步到文件中数据的一个备份, 以便在遇到系统 Crash

或者主机断电的时候,能够校验最后一次文件同步是否准确的完成了,如果未完

成,则可以通过这个备份来继续完成工作,保证数据的正确性。

那这样 Innodb 不是又一次增加了整体 IO

量了吗?这样不是可能会影响系统的性能么?这个完全不用 太担心,因为 Double Write Buffer 是一块连续的磁盘空间,所有写入

Double Write Buffer 的操作都是 连续的顺序写入操作,与整个同步过程相比,这点 IO

消耗所占的比例是非常小的。为了保证数据的准确 性,这样一点点性能损失是完全可以接受的。

实际上,并不是所有的场景都需要使用 Double

Write 这样的机制来保证数据的安全准确性,比如当 我们使用某些特别文件系统的时候,如在 Solaris 平台上非常著名的 ZFS

文件系统,他就可以自己保证文 件写入的完整性。而且在我们的 Slave 端,也可以禁用 Double Write 机制。

Adaptive  Hash Index

在 Innodb

中,实现了一个自动监测各表索引的变化情况的机制,然后通过一系列的算法来判定如果 存在一个 Hash Index

是否会对索引搜索带来性能改善。如果 Innodb 认为可以通过 Hash Index 来提高检 索效率,他就会在内部自己建立一个基于某个

B-Tree 索引的 Hash Index,而且会根据该 B-Tree 索引的 变化自行调整,这就是我们常说的 Adaptive  Hash

Index。当然,Innodb

并不一定会将整个 B-Tree 索引 完全的转换为 Hash Index,可能仅仅只是取用该 B-Tree 索引键一定长度的前缀来构造一个

Hash Index。

Adaptive  Hash Index

并不会进行持久化存放在磁盘上面,仅仅存在于 Buffer  Pool 中。所以,在每 次 MySQL 刚启动之后是并不存在 Adaptive

Hash Index 的,只有在停工服务之后,Innodb 才会根据相应 的请求来构建。

Adaptive  Hash Index 的目的并不是为了改善磁盘 IO 的性能,而是为了提高 Buffer  Pool 中的数据 的访问效率,说的更浅显一点就是给 Buffer  Pool 中的数据做的索引。所以,Innodb 在具有大容量内存

(可以设置大的 Buffer  Pool)的主机上,对于其他存储引擎来说,会存在一定的性能优势。

关于InnoDB如何分配内存的问题有很多。在此,我会给出一些关于数据库启动时内存分配的解释。

下面是一些重要的常量:

1. NBLOCKS:等于innodb_buffer_pool中的块总数,也就是innodb_buffer_pool_size / 16384

2. OS_THREADS:如

果innodb_buffer_pool_size >=

1000MB,那么等于50000;如果innodb_buffer_pool_size >=

8MB,那么等于10000;否则,等于1000(这种计算方法适用于Linux/Unix系统,Windows有另外一种计算OS_THREADS的方

法)。

因此,InnoDB会使用:

1. innodb_buffer_pool

2. innodb_additional_mem_pool_size

3. innodb_log_buffer_size

4. 自适应的索引哈希,大小为innodb_buffer_pool / 64

5. 系统字典哈希,大小为6 * innodb_buffer_pool_size / 512

6. sync_array使用的内存,可用于同步原语,大小为OS_THREADS * 152

7. os_events使用的内存,同样可用于同步原语,大小为OS_THREADS * 216

8. 锁定系统使用的内存,大小为5 * 4 * NBLOCKS

因此,计算InnoDB使用内存的最终公式如下:

innodb_buffer_pool_size +

innodb_log_buffer_size + innodb_additional_mem_pool_size + 812 / 16384 *

innodb_buffer_pool_size + OS_THREADS * 368

为了简化上述公式,我们可以使用:

812 / 16384 * innodb_buffer_pool_size ~~ innodb_buffer_pool_size / 20

并且,如果innodb_buffer_pool > 1000MB,则OS_THREADS * 368 = 17.5MB;如果innodb_buffer_pool > 8MB,则OS_THREADS * 368 = 3.5MB。

例如,如果你设置的

innodb_buffer_pool_size=1500M,innodb_additional_mem_pool_size =

20M,innodb_log_buffer_size = 8M,那么InnoDB将会分配的内存大小为1500M + 20M + 8M +

1500/20M + 17.5M,也就是1620.5M。

当你规划服务器的内存使用时,请慎重考虑额外使用的内存。

mysql innodb 缓存设置_数据库分享一: MySQL的Innodb缓存相关优化相关推荐

  1. wamp mysql外键设置_数据库外键是什么意思

    数据库外键是什么意思? 外键(FK)是用于建立和加强两个表数据之间的链接的一列或多列.通过将保存表中主键值的一列或多列添加到另一个表中,可创建两个表之间的链接.这个列就成为第二个表的外键. 当创建或更 ...

  2. MySQL有几部分_数据库部分(MySql)_4

    约束 约束:给表的字段名添加限制条件; 非空约束(not null):添加非空约束后,字段值不能为null: 唯一约束(unique):添加唯一约束后,字段值不能重复: 主键约束(primary ke ...

  3. mysql nosql 游戏开发_数据库减压--php+mysql+memcached模拟nosql

    随着数据量的不断增加,数据库的压力会逐渐增加,打开的速度会越来越慢,甚至出现数据库的slow-query,即使已经建立了完善的索引. 这个时候我们通常会采取几种方法来减轻数据库的压力: 读写分离,采取 ...

  4. mysql 多线程_数据库选型之MySQL(多线程并发)

    本博客记录作者在工作与研究中所经历的点滴,一方面给自己的工作与生活留下印记,另一方面若是能对大家有所帮助,则幸甚至哉矣! 简介 鉴于高频中心库task部分占用机器较多,为节省成本,调研数据库或缓存.在 ...

  5. MySQL学习笔记01【数据库概念、MySQL安装与使用】

    MySQL 文档-黑马程序员(腾讯微云):https://share.weiyun.com/RaCdIwas 1-MySQL基础.pdf.2-MySQL约束与设计.pdf.3-MySQL多表查询与事务 ...

  6. mysql 保证事物完整性_数据库高并发请求,如何保证数据完整性?详解MySQL/InnoDB的加锁...

    本文是对MySQL/InnoDB中,乐观锁.悲观锁.共享锁.排它锁.行锁.表锁.死锁概念的理解,这些在面试中也经常遇到,如数据库高并发请求,如何保证数据完整性?今天我查阅资料进行了MySQL/Inno ...

  7. mysql分布式主键_技术分享 | 优化 InnoDB 的主键

    作者:Yves Trudeau 翻译:管长龙 前言 作为 Percona 的首席架构师,我的主要职责之一是对客户的数据库进行性能方面的优化,这使得工作复杂且非常有趣.在这篇文章中,我想讨论一个最重要的 ...

  8. 数据库助手连接MySQL设置_数据库简易设置助手下载_数据库简易设置助手官方版下载_3DM单机...

    <数据库简易设置助手>是一款数据库配置工具,能够高效便捷对数据库进行管理工作,他支持一件关闭开启数据库,并能够设置服务启动类型,支持一键设置jdk环境,支持系统中安装多个版本的JDk环境, ...

  9. 【MySQL 第10章_数据库的设计规范】

    第10章_数据库的设计规范 1. 为什么需要数据库设计 2.范式 2.1范式简介 2.2范式都包括哪些 2.3 键和相关属性的概念 2.4第一范式(1st NF) 2.5 第二范式(2nd NF) 2 ...

最新文章

  1. golang RSA (PKCS#1)加密解密
  2. 第四范式送上2022虎年祝福
  3. Qt工作笔记-setWindowFlags的巧妙使用(使用|、、~运算符)
  4. pitr 原理_pgsql的备份和恢复
  5. 浏览器同步测试神器 — BrowserSync
  6. eclipse svn 分支合并到主干
  7. IAR编译32K限制
  8. code405是什么意思_HTTP返回reponse code 405
  9. Java - java代码实现ip归属地查询,调用百度ip地址查询,局域网也能查询到位置
  10. Ubuntu卸载历程,包含重启进入grub解决方案
  11. 因涉政内容导致域名被封禁
  12. 【Leetcode_SQL】1179.重新格式化部门表
  13. 10.发布者Publisher的编程实现
  14. Spring loosely coupled example
  15. android 全局菜单键,视听效果都很出色的超值之选 OPPO智能电视K9评测
  16. DecimalFormat使用心得
  17. 当mybatisPlus与tk.mybatis遇到更新
  18. Android 内核加载fw通用方法分析
  19. j-flash烧写NXP的S32k1**系列单片机(jlink)
  20. 优雅编程之这样使用CollectionUtils,你就“正常”了(三十五)

热门文章

  1. linux 设备驱动阻塞,深入浅出:Linux设备驱动中的阻塞和非阻塞I/O
  2. 两个选择框 ajax如何根据另一个选择框的内容获取_Python数据结构:数据框
  3. tensorflow 入门笔记(二)
  4. 增强型的for循环linkedlist_38. 为什么千万别用for循环迭代LinkedList
  5. pythoncharm如何安装opencv_Pycharm Opencv环境配置
  6. AcWing 4244. 牛的比赛(双向建图BFS)
  7. Pandas如何检测None和Nan
  8. 计算机视觉︱图像取证技术
  9. [Flink]Flink DataStream API 概览
  10. [hystar整理]Entity Framework 教程