自 Caché 2017 以后，SQL 引擎包含了一些新的统计信息。这些统计信息记录了执行查询的次数以及运行查询所花费的时间。

对于想要对包含许多 SQL 语句的应用程序的性能进行监控和尝试优化的人来说，这是一座宝库，但访问数据并不像一些人希望的那么容易。

本文和相关的示例代码说明了如何使用这些信息，以及如何例行提取每日统计信息的摘要，并保存应用程序的 SQL 性能的历史记录。

记录了什么？

每次执行 SQL 语句时，都记录花费的时间。这是非常轻量的操作，无法关闭。为了最大程度地降低开销，统计信息保留在内存中并定期写入磁盘。数据包括一天中执行查询的次数以及所花费的平均时间和总时间。

数据不会立即写入磁盘，并且在写入之后，统计信息将由“更新 SQL 查询统计信息”任务更新，该任务通常计划为每小时运行一次。该任务可以手动触发，但是如果你希望在测试查询时实时查看统计信息，则整个过程需要一点耐心。

警告：在 InterSystems IRIS 2019 及更早版本中，不会针对已使用 %Studio.Project:Deploy 机制部署的类或例程中的嵌入式 SQL 收集这些统计信息。示例代码不会有任何中断，但这可能会使你产生误导(我被误导过)，让你以为一切正常，因为没有查询显示为高开销。

如何查看信息？

你可以在管理门户中查看查询列表。转到 SQL 页面，点击“SQL 语句”选项卡。对于你正在运行并查看的新查询，这种方式很好；但是如果有数千条查询正在运行，则可能变得难以管理。

另一种方法是使用 SQL 搜索查询。信息存储在 INFORMATION_SCHEMA 模式的表中。该模式含有大量表，我在本文的最后附上了一些 SQL 查询示例。

何时删除统计信息？

每次重新编辑查询时会删除其数据。因此对于动态查询，这可能意味着清除缓存的查询时。对于嵌入式 SQL，则意味着重新编译在其中嵌入 SQL 的类或例程时。

在活跃的站点上，可以合理预期统计信息将保存超过一天，但是存放统计信息的表不能用作运行报告或长期分析的长期参考源。

如何汇总信息？

我建议每天晚上将数据提取到永久表中，这些表在生成性能报告时更易于使用。如果在白天编译类，可能会丢失一些信息，但这不太可能对慢速查询的分析产生任何实际影响。

下面的代码示例说明了如何将每个查询的统计信息提取到每日汇总中。它包括三个简短的类：

一个应在每晚运行的任务。
DRL.MonitorSQL 是主类，用于从 INFORMATION_SCHEMA 表提取数据并存储。
第三个类 DRL.MonitorSQLText 是一个优化类，它存储一次(可能很长的)查询文本，并且只将查询的哈希存储在每天的统计信息中。

示例说明

该任务提取前一天的信息，因此应安排在午夜后不久执行。

你可以导出更多历史数据，只要其存在。要提取过去 120 天的数据

Do ##class(DRL.MonitorSQL).Capture($h-120,$h-1)

该示例代码直接读取全局 ^rIndex，因为最早版本的统计信息未将日期公开给 SQL。

我所包括的变体将循环实例中的所有命名空间，但这并不总是合适的。

如何查询已提取的数据

提取数据后，您可以通过运行以下语句查找最繁重的查询

SELECT top 20
S.RunDate,S.RoutineName,S.TotalHits,S.SumpTIme,S.Hash,t.QueryText
from DRL.MonitorSQL S
left join DRL.MonitorSQLText T on S.Hash=T.Hash
where RunDate='08/25/2019'
order by SumpTime desc

此外，如果选择了开销大的查询的哈希，可以通过以下语句查看该查询的历史记录

SELECT S.RunDate,S.RoutineName,S.TotalHits,S.SumpTIme,S.Hash,t.QueryText
from DRL.MonitorSQL S
left join DRL.MonitorSQLText T on S.Hash=T.Hash
where S.Hash='CgOlfRw7pGL4tYbiijYznQ84kmQ='
order by RunDate

今年早些时候，我获取了一个活跃站点的数据，然后查看了开销最大的查询。有一个查询的平均时间不到 6 秒，但每天被调用 14000 次，加起来每天消耗的时间将近 24 小时。实际上，一个核心完全被这个查询占用。更糟糕的是，第二个查询要花一个小时，它是第一个查询的变体。

运行日期	例程名称	总命中次数	总时间	哈希	查询文本(有节略)
03/16/2019		14,576	85,094	5xDSguu4PvK04se2pPiOexeh6aE=	DECLARE C CURSOR FOR SELECT * INTO :%col(1) , :%col(2) , :%col(3) , :%col(4) …
03/16/2019		15,552	3,326	rCQX+CKPwFR9zOplmtMhxVnQxyw=	DECLARE C CURSOR FOR SELECT * INTO :%col(1) , :%col(2) , :%col(3) , :%col(4) , …
03/16/2019		16,892	597	yW3catzQzC0KE9euvIJ+o4mDwKc=	DECLARE C CURSOR FOR SELECT * INTO :%col(1) , :%col(2) , :%col(3) , :%col(4) , :%col(5) , :%col(6) , :%col(7) ,
03/16/2019		16,664	436	giShyiqNR3K6pZEt7RWAcen55rs=	DECLARE C CURSOR FOR SELECT * , TKGROUP INTO :%col(1) , :%col(2) , :%col(3) , ..
03/16/2019		74,550	342	4ZClMPqMfyje4m9Wed0NJzxz9qw=	DECLARE C CURSOR FOR SELECT …

表 1：客户站点的实际结果

INFORMATION_SCHEMA 模式中的表

除了统计信息外，此模式中的表还会跟踪查询、列、索引等的使用位置。通常，SQL 语句是起始表，它的连接方式类似于“Statements.Hash=OtherTable.Statement”。

直接访问这些表以查找一天中开销最大的查询，这一操作的等效查询是...

SELECT DS.Day,Loc.Location,DS.StatCount,DS.StatTotal,S.Statement,S.Hash
FROM INFORMATION_SCHEMA.STATEMENT_DAILY_STATS DS
left join INFORMATION_SCHEMA.STATEMENTS  S
on S.Hash=DS.Statement
left join INFORMATION_SCHEMA.STATEMENT_LOCATIONS  Loc
on S.Hash=Loc.Statement
where Day='08/26/2019'
order by DS.stattotal desc

无论你是否考虑建立一个更系统的过程，我都建议每个使用 SQL 处理大型应用程序的人今天都运行这个查询。

如果某个特定查询显示为高开销，则可以通过运行以下语句获取历史记录

SELECT DS.Day,Loc.Location,DS.StatCount,DS.StatTotal,S.Statement,S.Hash
FROM INFORMATION_SCHEMA.STATEMENT_DAILY_STATS DS
left join INFORMATION_SCHEMA.STATEMENTS  S
on S.Hash=DS.Statement
left join INFORMATION_SCHEMA.STATEMENT_LOCATIONS  Loc
on S.Hash=Loc.Statement
where S.Hash='jDqCKaksff/4up7Ob0UXlkT2xKY='
order by DS.Day

每日提取统计信息的代码示例

标准免责声明 - 此示例仅用于说明。不对其提供支持，也不保证其有效。

Class DRL.MonitorSQLTask Extends %SYS.Task.Definition{Parameter TaskName = "SQL Statistics Summary";Method OnTask() As %Status{set tSC=$$$OKTRY {do ##class(DRL.MonitorSQL).Run()}CATCH exp {set tSC=$SYSTEM.Status.Error("Error in SQL Monitor Summary Task")}quit tSC }}

Class DRL.MonitorSQLText Extends %Persistent{/// Hash of query textProperty Hash As %String;

/// query text for hashProperty QueryText As %String(MAXLEN = 9999);Index IndHash On Hash [ IdKey, Unique ];}

/// Summary of very low cost SQL query statistics collected in Cache 2017.1 and later. /// Refer to documentation on "SQL Statement Details" for information on the source data. /// Data is stored by date and time to support queries over time. /// Typically run to summarise the SQL query data from the previous day.Class DRL.MonitorSQL Extends %Persistent{/// RunDate and RunTime uniquely identify a runProperty RunDate As %Date;/// Time the capture was started/// RunDate and RunTime uniquely identify a runProperty RunTime As %Time;

/// Count of total hits for the time period for Property TotalHits As %Integer;

/// Sum of pTimeProperty SumPTime As %Numeric(SCALE = 4);

/// Routine where SQL is foundProperty RoutineName As %String(MAXLEN = 1024);

/// Hash of query textProperty Hash As %String;

Property Variance As %Numeric(SCALE = 4);

/// Namespace where queries are runProperty Namespace As %String;

/// Default run will process the previous days data for a single day./// Other date range combinations can be achieved using the Capture method.ClassMethod Run(){//Each run is identified by the start date / time to keep related items togetherset h=$h-1do ..Capture(+h,+h)}

/// Captures historic statistics for a range of datesClassMethod Capture(dfrom, dto){set oldstatsvalue=$system.SQL.SetSQLStatsJob(-1)set currNS=$znspaceset tSC=##class(%SYS.Namespace).ListAll(.nsArray)set ns=""set time=$piece($h,",",2)kill ^||TMP.MonitorSQLdo {set ns=$o(nsArray(ns))quit:ns=""use 0 write !,"processing namespace ",nszn nsfor dateh=dfrom:1:dto {set hash=""set purgedun=0do {set hash=$order(^rINDEXSQL("sqlidx",1,hash))continue:hash=""set stats=$get(^rINDEXSQL("sqlidx",1,hash,"stat",dateh))continue:stats=""set ^||TMP.MonitorSQL(dateh,ns,hash)=stats&SQL(SELECT Location into :tLocation FROM INFORMATION_SCHEMA.STATEMENT_LOCATIONS WHERE Statement=:hash)if SQLCODE'=0 set Location=""set ^||TMP.MonitorSQL(dateh,ns,hash,"Location")=tLocation&SQL(SELECT Statement INTO :Statement FROM INFORMATION_SCHEMA.STATEMENTS WHERE Hash=:hash)if SQLCODE'=0 set Statement=""set ^||TMP.MonitorSQL(dateh,ns,hash,"QueryText")=Statement} while hash'=""}} while ns'=""zn currNSset dateh=""do {set dateh=$o(^||TMP.MonitorSQL(dateh))quit:dateh=""set ns=""do {set ns=$o(^||TMP.MonitorSQL(dateh,ns))quit:ns=""set hash=""do {set hash=$o(^||TMP.MonitorSQL(dateh,ns,hash))quit:hash=""set stats=$g(^||TMP.MonitorSQL(dateh,ns,hash))continue:stats=""// The first time through the loop delete all statistics for the day so it is re-runnable// But if we run for a day after the raw data has been purged, it will wreck eveything// so do it here, where we already know there are results to insert in their place.if purgedun=0 {&SQL(DELETE FROM websys.MonitorSQL WHERE RunDate=:dateh )set purgedun=1}set tObj=##class(DRL.MonitorSQL).%New()

set tObj.Namespace=nsset tObj.RunDate=datehset tObj.RunTime=timeset tObj.Hash=hashset tObj.TotalHits=$listget(stats,1)set tObj.SumPTime=$listget(stats,2)set tObj.Variance=$listget(stats,3)set tObj.Variance=$listget(stats,3)set queryText=^||TMP.MonitorSQL(dateh,ns,hash,"QueryText")set tObj.RoutineName=^||TMP.MonitorSQL(dateh,ns,hash,"Location")&SQL(Select ID into :TextID from DRL.MonitorSQLText where Hash=:hash)if SQLCODE'=0 {set textref=##class(DRL.MonitorSQLText).%New()set textref.Hash=tObj.Hashset textref.QueryText=queryTextset sc=textref.%Save()} set tSc=tObj.%Save()//avoid dupicating the query text in each record because it can be very long. Use a lookup//table keyed on the hash. If it doesn't exist add it.if $$$ISERR(tSc) do $system.OBJ.DisplayError(tSc)

if $$$ISERR(tSc) do $system.OBJ.DisplayError(tSc)} while hash'=""} while ns'=""} while dateh'=""do $system.SQL.SetSQLStatsJob(0)}

Query Export(RunDateH1 As %Date, RunDateH2 As %Date) As %SQLQuery{SELECT S.Hash,RoutineName,RunDate,RunTime,SumPTime,TotalHits,Variance,RoutineName,T.QueryTextFROM DRL.MonitorSQL S LEFT JOIN DRL.MonitorSQLText T on S.Hash=T.HashWHERE RunDate>=:RunDateH1 AND RunDate:RunDateH2}}

InterSystems 最佳实践系列---APM – 监控 SQL 查询性能相关推荐

小微企业阿里云最佳实践系列（二）：RDS 数据库与DMS 数据库管理（数据管理）...
关联博文小微企业阿里云最佳实践系列(一):ECS 服务器与 RDS 数据库概述阅读对象本博文主要写给创业团队.技术团队人数 < 5 人.没有专业运维等小微企业作为参考,需要掌握基础的服务 ...
小微企业阿里云最佳实践系列（二）：RDS 数据库与DMS 数据库管理（数据管理）... 1
关联博文小微企业阿里云最佳实践系列(一):ECS 服务器与 RDS 数据库概述阅读对象本博文主要写给创业团队.技术团队人数 < 5 人.没有专业运维等小微企业作为参考,需要掌握基础的服务 ...
TiDB 最佳实践系列（三）乐观锁事务
TiDB 最佳实践系列是面向广大 TiDB 用户的系列教程,旨在深入浅出介绍 TiDB 的架构与原理,帮助用户在生产环境中最大限度发挥 TiDB 的优势.我们将分享一系列典型场景下的最佳实践路径,便于 ...
55最佳实践系列：MongoDB最佳实践
@郑昀汇总创建日期:2012/9 Application Design: 1) 如果发现query没使用你预期的索引,请用hint强制使用指定索引主站商品中心所使用的文档字段很多,各种索引建得也不 ...
最佳实践系列：前端代码标准和最佳实践
最佳实践系列:前端代码标准 @窝窝商城前端(刘轶/李晨/徐利/穆尚)翻译于2012年版本0.55 @郑昀校对 isobar的这个前端代码标准和最佳实践文档,涵盖了Web应用开发的方方面面,我们翻译了 ...
最佳实践系列丨Docker EE 服务发现参考架构（二）
出品丨Docker公司(ID:docker-cn) 编译丨小东每周一.三.五晚6点10分与您不见不散服务发现对服务进行注册并发布其连接信息,以使其他服务了解如何连接到服务.随着应用向微服务和面向 ...
深度学习最佳实践系列——权重w初始化
摘要: 本文是深度学习最佳实践系列博客之权重初始化,主要介绍权重初始化的相关问题及方法,文中提及的权重初始化方法均可以应用于普通的神经网络.卷积神经网络和递归神经网络之中. 作为深度学习的初学者,我有 ...
信创办公–基于WPS的PPT最佳实践系列（将幻灯片组织成节的形式）
信创办公–基于WPS的PPT最佳实践系列 (将幻灯片组织成节的形式) 目录应用背景操作步骤 1.创建节 2.节的功能应用背景当在处理一份内容较多的演示文稿时,为了更好的整理和查阅,我们可以将幻 ...
天云大数据_【案例分享】天云大数据最佳实践系列之——信用评分模型
本文为天云大数据原创大数据能力特有的性质,使其正在成为大型银行真正的核心竞争力.银行大数据能力表现在多方面,但大数据思维和数据挖掘能力是最关键.也是最重要的.天云大数据自成立以来,一直深耕于金融领域 ...

InterSystems 最佳实践系列---APM – 监控 SQL 查询性能