有很多地方可以设置定时任务,比如:Windows的计划任务,Linux下的crontab,各种开发工具里的timer组件。SQL Server也有它的定时任务组件 SQL Server Agent,基于它可以方便的部署各种数据库相关的作业(job)。

. 作业历史纪录

作业的历史纪录按时间采用FIFO原则,当累积的作业历史纪录达到上限时,就会删除最老的纪录。

1. 作业历史纪录数配置

所有作业总计纪录条数默认为1000,最多为999999条;单个作业总计记录条数默认为100,最多为999999条。有下面2种方式可以进行修改:

(1) SSMS/SQL Server Agent/属性/历史;

(2) 未记载的扩展存储过程,SQL Server 2005及以后版本适用,以下脚本将记录数设回默认值:

EXEC msdb.dbo.sp_set_sqlagent_properties @jobhistory_max_rows=-1,@jobhistory_max_rows_per_job=-1
GO

2. 删除作业历史纪录

(1) SSMS/SQL Server Agent/右击作业文件夹或某个作业/查看历史纪录/清除

在SQL Server 2000中会一次清除所有作业历史记录,SQL Server 2005 及以后版本可以有选择的清除某个作业/某个时间之前的历史纪录;

(2) SQL Server 2005及以后版本,提供了系统存储过程如下:

--清除所有作业15天前的纪录
DECLARE @OldestDate datetime
SET @OldestDate = GETDATE()-15
EXEC msdb.dbo.sp_purge_jobhistory @oldest_date=@OldestDate--清除作业”Test”3天前的纪录
DECLARE @OldestDate datetime
DECLARE @JobName varchar(256)
SET @OldestDate = GETDATE()-3
SET @JobName = 'Test'
EXEC msdb.dbo.sp_purge_jobhistory @job_name=@JobName, @oldest_date=@OldestDate

作业历史纪录数有上限,通常不需要手动去删除。

3. 保留作业历史纪录

即便设置了历史记录上限到999999,如果作业很多,加之作业运行很频繁,最终历史记录还是会被慢慢删除掉。

如果想要保留某些作业历史的记录,可以打开作业属性/步骤/编辑/高级,选择将这个步骤的历史记录输出到文件/自定义表中,如下图:

. 作业运行状态

界面上可以通过: SSMS/SQL Server Agent/右击作业文件夹或某个作业/查看历史纪录,如下用SQL 语句检查作业状态。

1. 作业上次运行状态及时长

利用系统表msdb.dbo.sysjobhistory:

(1) 表中的run_status字段表示作业上次运行状态,有0~3共4种状态值,详见帮助文档,另外在2005的帮助文档中写到:sysjobhistory的run_status为4表示运行中,经测试是错误的,在2008的帮助中已没有4这个状态;

(2) 表中run_duration字段表示作业上次运行时长,格式为HHMMSS,比如20000则表示运行了2小时。

如下脚本查看所有作业最后一次运行状态及时长:

if OBJECT_ID('tempdb..#tmp_job') is not nulldrop table #tmp_job--只取最后一次结果
select job_id,run_status,CONVERT(varchar(20),run_date) run_date,CONVERT(varchar(20),run_time) run_time,CONVERT(varchar(20),run_duration) run_durationinto #tmp_jobfrom msdb.dbo.sysjobhistory jh1where jh1.step_id = 0and (select COUNT(1) from msdb.dbo.sysjobhistory jh2 where jh2.step_id = 0 and (jh1.job_id = jh2.job_id)and (jh1.instance_id <= jh2.instance_id))=1--排除syspolicy_purge_history这个系统作业
select a.name job_name,case b.run_status when 0 then 'Failed'when 1 then 'Succeeded'when 2 then 'Retry'when 3 then 'Canceled'else 'Unknown' end as job_status,LEFT(run_date,4)+'-'+SUBSTRING(run_date,5,2)+'-'+RIGHT(run_date,2)+SPACE(1)+LEFT(RIGHT(1000000+run_time,6),2)+':'+SUBSTRING(RIGHT(1000000+run_time,6),3,2)+':'+RIGHT(RIGHT(1000000+run_time,6),2) as job_started_time,+LEFT(RIGHT(1000000+run_duration,6),2)+':'+SUBSTRING(RIGHT(1000000+run_duration,6),3,2)+':'+RIGHT(RIGHT(1000000+run_duration,6),2) as job_durationfrom msdb.dbo.sysjobs a left join    #tmp_job b on a.job_id=b.job_id where a.name not in ('syspolicy_purge_history')and a.enabled = 1order by b.run_status asc,a.name,b.run_duration desc

2. 作业当前运行状态及时长

什么时候可能要检查作业的当前状态?

(1) 需要关闭SQL Server或SQL Server Agent服务时;

(2) 等到当前作业完成,有后续动作;

(3) 纯粹只是查看当前作业运行到哪个步骤等等。

通过SSMS/SQL Server Agent/右击作业文件夹或某个作业/查看历史纪录,看到的作业历史记录存放在:

select * from msdb.dbo.sysjobhistory

需要注意的是:至少作业已完成第一步运行,sysjobhistory表中才会有作业历史纪录,若当前作业没有完成任何一个步骤,那表里就不会有本次运行纪录。所以作业当前状态用有时无法通过sysjobhistory查看,尤其是作业只有1个步骤且运行时间很长时。

2.1. SQL Server 2005及以后版本

(1) 当前运行状态:系统存储过程msdb.dbo.sp_help_job,返回所有作业的运行状态(current_execution_status),共7种状态值,详见帮助文档。查看所有作业状态如下:

exec msdb..sp_help_job

(2) 当前运行时长:系统存储过程sp_help_job无法获得作业运行时长,可通过新增的系统表sysjobactivity来查看。查看正在运行的作业如下:

select a.name,b.start_execution_date,DATEDIFF(MI,b.start_execution_date,GETDATE()) as job_durationfrom msdb..sysjobs ainner join msdb..sysjobactivity bon a.job_id = b.job_idwhere b.start_execution_date is not nulland b.stop_execution_date is null 

以下脚本结合sp_help_job和sysjobactivity,得到作业的当前状态及时长:

exec sp_configure 'show advanced options',1
RECONFIGURE
exec sp_configure 'Ad Hoc Distributed Queries',1
RECONFIGUREif OBJECT_ID('tempdb..#jobinfo') is not nulldrop table #jobinfoselect * into #jobinfo
from openrowset('sqloledb', 'server=(local);trusted_connection=yes','exec msdb.dbo.sp_help_job')select a.name,j.current_execution_status,b.start_execution_date,DATEDIFF(MI,b.start_execution_date,GETDATE()) as job_duration_minutefrom msdb..sysjobs ainner join msdb..sysjobactivity bon a.job_id = b.job_idinner join #jobinfo jon a.job_id = j.job_id    where b.start_execution_date is not nulland b.stop_execution_date is null 

2.2. SQL Server 2000沿用过来的方法

在SQL Server 2000时,没有sysjobactivity这个系统表,通常借助sysprocesses监视作业的当前运行状态及时长。

select j.name, p.status as current_execution_status, p.last_batch as start_execution_date,ISNULL(DATEDIFF(MI, p.last_batch, GETDATE()), 0) as job_duration_minutefrom msdb.dbo.sysjobs j, master..sysprocesses pwhere p.program_name like 'SQLAgent - TSQL JobStep (Job%'and substring((cast(j.job_id as varchar(36))),7,2) +substring((cast(j.job_id as varchar(36))),5,2) +substring((cast(j.job_id as varchar(36))),3,2) +substring((cast(j.job_id as varchar(36))),1,2) +substring((cast(j.job_id as varchar(36))),12,2) +substring((cast(j.job_id as varchar(36))),10,2) +substring((cast(j.job_id as varchar(36))),17,2) +substring((cast(j.job_id as varchar(36))),15,2) +substring((cast(j.job_id as varchar(36))),20,4) +substring((cast(j.job_id as varchar(36))),25,12) = substring((cast(p.program_name as varchar(75))),32,32)

sysprocesses里获得的作业编号跟sysjobs里是不一致的,所以上面进行了转换,通常只转换job_id的前8位字符也行,如下脚本做了job_id的简化转换,并检查作业已运行超过30分钟:

declare @MaxMinutes intset @MaxMinutes = 30 select j.name, p.status as current_execution_status, p.last_batch as start_execution_date,ISNULL(DATEDIFF(MI, p.last_batch, GETDATE()), 0) as job_duration_minutefrom msdb..sysjobs jinner join master..sysprocesses pon substring(left(cast(j.job_id as varchar(36)),8),7,2) +substring(left(cast(j.job_id as varchar(36)),8),5,2) +substring(left(cast(j.job_id as varchar(36)),8),3,2) +substring(left(cast(j.job_id as varchar(36)),8),1,2) = substring(p.program_name,32,8)where p.program_name like 'SQLAgent - TSQL JobStep (Job%'and ISNULL(DATEDIFF(MI, p.last_batch, GETDATE()), 0) > @MaxMinutes

还有种比较笨的方法,在要监视的所有作业中增加一个步骤,如 : select GETDATE() 放在第一步,这样在sysjobhistory中就会有步骤1的运行纪录了,以此为起点,可以计算已运行时长。如果有很多已经部署的job,这确实不是个好办法。

又或者,在每个作业最后一步,放一个检查的步骤,这样所有状态时长全都监视到了,问题是如果作业运行时间过长,最后的检查步骤根本无法被运行到。

. 作业状态告警

作业在完成后,自己有状态检查和告警机制,通常选择邮件告警,如下图:

但这仅限对作业最终运行状态监视:

(1) 没有运行结束的作业无法告警,或者说对作业的运行时长没有监视;

(2) 如果作业在某个中间步骤设置了:失败后继续下一步,后续的作业步骤都成功,那么作业最终状态不会显示会失败,不会触发告警,如下脚本检查每个作业的所有步骤最后一次运行状态:

if OBJECT_ID('tempdb..#tmp_job_step') is not nulldrop table #tmp_job_stepselect jh1.job_id,jh1.step_id,jh1.run_status,CONVERT(varchar(20),jh1.run_date) run_date,CONVERT(varchar(20),jh1.run_time) run_time,CONVERT(varchar(20),jh1.run_duration) run_durationinto #tmp_job_stepfrom msdb.dbo.sysjobhistory jh1where (select COUNT(1) from msdb.dbo.sysjobhistory jh2 where (jh1.job_id = jh2.job_id and jh1.step_id = jh2.step_id)and (jh1.instance_id <= jh2.instance_id))=1select a.name job_name,s.step_name,case b.run_status when 0 then 'Failed'when 1 then 'Succeeded'when 2 then 'Retry'when 3 then 'Canceled'else 'Unknown' end as job_status,LEFT(run_date,4)+'-'+SUBSTRING(run_date,5,2)+'-'+RIGHT(run_date,2)+SPACE(1)+LEFT(RIGHT(1000000+run_time,6),2)+':'+SUBSTRING(RIGHT(1000000+run_time,6),3,2)+':'+RIGHT(RIGHT(1000000+run_time,6),2) as job_started_time,+LEFT(RIGHT(1000000+run_duration,6),2)+':'+SUBSTRING(RIGHT(1000000+run_duration,6),3,2)+':'+RIGHT(RIGHT(1000000+run_duration,6),2) as job_durationfrom msdb.dbo.sysjobs a left join    #tmp_job_step b on a.job_id=b.job_idinner join msdb.dbo.sysjobsteps son b.job_id = s.job_id and b.step_id = s.step_idwhere a.name not in ('syspolicy_purge_history')and a.enabled = 1order by b.run_status asc,a.name,b.run_duration desc

小结

SQL Server Agent作业自身的告警机制,有时并不够用,所以还需要部署另外的作业,来检查其他所有作业的运行状况,大致步骤如下 :

(1) 部署数据库邮件;

(2) 部署作业:定时检查其他所有作业/步骤状态,发邮件告警;

作业运行时长可以在这一并检查,有时一些作业运行了很多天没结束还没人知道,也可以考虑放在性能监控里,和其他数据库请求一起监控。但是对于时长,通常需要有个性能基线,如果没有的话直接和历史最大值相比也是不错的选择。

转载于:https://www.cnblogs.com/seusoftware/p/3957484.html

4. SQL Server数据库状态监控 - 作业状态相关推荐

  1. (转)SQL Server数据库状态监控 - 作业状态

    4. SQL Server数据库状态监控 - 作业状态 有很多地方可以设置定时任务,比如:Windows的计划任务,Linux下的crontab,各种开发工具里的timer组件.SQL Server也 ...

  2. 3. SQL Server数据库状态监控 - 可用空间

    数据库用来存放数据,那么肯定需要存储空间,所以对磁盘空间的监视自然就很有必要了. 一. 磁盘可用空间 1. 操作系统命令或脚本.接口或工具 (1) DOS命令: fsutil volume diskf ...

  3. 5. SQL Server数据库性能监控 - 当前请求

    5. SQL Server数据库性能监控 - 当前请求 原文:5. SQL Server数据库性能监控 - 当前请求 对于在线运行的系统,当前数据库性能监控,通常监视以下几点: (1) 是否有阻塞 ( ...

  4. SQL Server 数据库状态选项

    选项 1. single_user(单用户),multi_user(多用户),restricted_user(受限用户); 描述数据库的用户访问属性,它们互斥,设置其中任何一个选项就会取消对其它选项的 ...

  5. sqlsever Java监控_SQL Server数据库状态监控 - 错误日志

    无论是操作系统 (Unix 或者Windows),还是应用程序 (Web 服务,数据库系统等等) ,通常都有自身的日志机制,以便故障时追溯现场及原因.Windows Event Log和 SQL Se ...

  6. SQL server数据库监控

    今天主要介绍LinkSLA智能运维平台对SQL Server数据库的监控. 具体的监控内容如下 第一 .数据库服务器的基本性能监控.包括服务器的CPU数量,内存大小,服务器在线时间,在线数据实例个数, ...

  7. 探索SQL Server数据库的DATABASEPROPERTYEX()函数

    In this article, we explore a SQL function to extract SQL database metadata using the DATABASEPROPER ...

  8. aws rds监控慢sql_使用AWS Backup备份AWS RDS SQL Server数据库

    aws rds监控慢sql This article gives you an overview of creating backups of AWS RDS SQL Server database ...

  9. 基于Prometheus+Grafana监控SQL Server数据库

    墨墨导读:本文整理了基于Prometheus+Grafana监控SQL Server数据库的全过程,分享至此,希望对大家有帮助. 搭建SQL Server环境 使用容器建立SQL Server环境非常 ...

最新文章

  1. 好记性不如烂笔杆-android学习笔记二 Acitvity lifecycle 生命周期
  2. Composer使用
  3. unity加载sprite_Unity 利用UGUI打包图集,动态加载sprite资源
  4. jvm性能调优实战 -60 线上系统的JVM参数优化、GC问题定位排查、OOM分析解决
  5. 关于 RGB 的颜色认知
  6. 使用siege对varnish进行压测对比
  7. qt5 交叉编译webkit_Qtwebkit配置,设置交叉编译环境 - croop520的专栏 - 博客频道 - CSDN.NET...
  8. NIO中的几个基础概念
  9. java 字符串编码
  10. 普通的人改变结果,优秀的人改变原因,顶级优秀的人改变模型
  11. Atitit 获取mp3音乐文件的音乐名与歌手结构化元数据 nlp java 目录 1.1. 一、MP3文件的元数据 1 1.2. MP3文件的数据结构以及为mp3内嵌歌词的代码 3 1.3.
  12. start request repeated too quickly for docker.service
  13. 文本挖掘基本流程概述 分词和TF-IDF值计算方法介绍
  14. PyCharm配置Virtual Environment
  15. AI机器学习面试常见问题与答案
  16. Android简单的布局优化
  17. 当Forms表单遇到Power BI
  18. box-shadow四个边框设置阴影样式
  19. 解压命令tar zxvf中zxvf的意思
  20. 如何让照片保持一百年不变色——富士instax SHARE SP-2体验探秘

热门文章

  1. Android使用VideoView播放本地视频及网络视频Demo
  2. 4-1 复数类的运算符重载
  3. C# 类中继承接口的属性
  4. python web框架互相融合, Pyramid或取代Django
  5. [转] 视频直播前端方案
  6. Laravel源码入门-启动引导过程(四)app/Http/Kernel.php
  7. Python 日期时间函数
  8. winform记事本初步实现
  9. 恢复linux里被误删除的文件
  10. Handler(上)——Mars Andoird开发视频第二季第六集(重)