凌晨四点,整座城市几乎都在沉睡的时刻,在一个毫不起眼的办公室里,老王娴熟地弹了弹烟灰,又猛地灌了一大口枸杞茶,连续值了一周夜班的老王虽一身倦意,但严肃又较真的眼神依然时不时地扫过面前的几个监控界面,随即又盯着面前的座机发呆。这是某市的疫情防控指挥中心的值班室,当下疫情形势严峻,正值五一假期特殊时期,人员流动性远高于往日,防控任务也倍增于平时,几乎所有人员都被派出执行外勤任务,值班的任务只能压到临近退休的老王身上,作为老党员,他的思想觉悟是极高的,值班工作虽小但责任巨大。

突然,眼前的屏幕跳出了一条告警,不断闪烁的弹框异常的耀眼,老王心中警惕,扶了扶快要滑下鼻梁的老花镜,原来是某系统自动巡检功能弹出的新增黄码人员未处理的告警,老王心中疑惑:“昨天的全员核酸检测结果刚刚录入系统,没有异常情况,怎么突然多了19个黄码人员呢,难道是其他城市发现了阳性通过系统更新过来的密切接触的信息吗?也没收到通报信息啊。”老王拍拍快要秃顶的脑袋,自言自语道“人老了,电脑还没玩明白呢,又出来这么多的系统”,鼠标点开弹窗,新增黄码人员的信息一应俱全,明显的是现住址都是指向了老城区的某小区某栋某单元,按照预设的应急处置流程,老王抓起身旁的座机向上级汇报具体情况……

四点十分,老城区的某栋楼下警车、救护车已经就位,警戒线已经拉起,干警、医护人员已经全副武装,街道社区人员、物业人员纷纷赶来,睡梦中的住户被电话或者敲门声叫醒。与此同时,防控中心也在全力运作,查找突增黄码的原因,排除密切接触等真正使健康码变黄的原因之后,问题定位到了疫情防控内部系统上。一场乌龙事件最终以防疫演习的借口收场,虽然浪费了一些资源惊扰了部分民众,但大家还是坦然接受了,毕竟没有疫情是众望所归的事情。

IT主管在收到通知后第一时间赶到防控中心,协调各系统驻场工程师定位问题,应用系统工程师确认新增黄码告警是通过KingbaseES数据库检索出来的,并精简出该功能的SQL语句, 现场DBA确认SQL语句查询结果确实存在问题不符合预期;因KingbaseES数据库早已部署实施完成,暂无驻场人员,IT主管紧急联系KingbaseES数据库售后,KingbaseES技术支持小李临危受命,加急核酸取检测报告第一时间赶往现场。

小李在赶往现场的途中尽可能多的收集现场情况,并于当时实施人员取得联系,得知当初Kingbase数据库经过了连续五天的大压力测试,当实施人员提到现场是KingbaseES单机部署在一台临时调配的老服务器时,小李心里咯噔一下,这种老服务器的硬件可千万别出问题呀,一旦出现硬件问题就很难定位,并且老服务器硬件厂商的支持力度也是问题,但听实施提到还在服务器上安装了Kmonitor时,小李悬着的心又稍微放松了些,因为他清楚的知道KMonitor是一个全方位的监控平台,不仅实时监控着数据库的各项指标,比如性能指标,而且还监控着服务器硬件资源,比如磁盘状态、CPU内存使用情况。有了KMonitor,小李就可以很方便的通过图形化的界面检索各种监控历史数据,从而找到问题的突破口。

到达现场的小李斗志昂扬,看到了那条又臭又长的占据了大概一个多屏幕的SQL语句,在感慨应用系统开发工程师的蹩脚SQL技能之外,迅速确认了该SQL的执行结果,确实是这19个人的健康码莫名其妙的变黄了,没有任何关联事件和理由,也没有找到任何变黄的依据记录信息,这是不合理的,唯一的解释只能是KingbaseES数据库出错了。至于为什么出错了,小李第一时间打开熟悉的KMonitor平台,入眼即是各种指标、图表动态实时显示。

隔壁的应用开发工程师诧异地问道“这是什么东西,你们数据库查问题不都是开黑窗口敲命令吗?”,一旁的IT主管也是煞有介事地凑过来看了两眼评价“你们数据库还搞这么花哨的界面啊”。

小李撇了一眼那个应用开发工程师,喃喃自语地说起来,又向是在跟身边的两位炫耀:“这是我们公司的明星产品KMonitor监控工具,实时监控数据库的健康状况,一旦发现问题就会立即告警,帮助DBA和用户及早处理隐患,防患于未然。比如数据库性能降低,硬件资源出现问题,如果不及时处理就会导致服务中断甚至丢失数据……”

“赶紧找到原因,处理问题,别叨叨个没完了!”, IT主管有些着急地催了起来,心想着这个事故怎么向上汇报,他看见小李眉飞色舞地讲个不停莫名地来气,鼠标还不断地点击界面展示着数据库会话、阻塞死锁、缓存命中的实时监控图表。

应用开发工程师忍不住“噗”了一声,借着话头不咸不淡地问:“数据库不是出问题了吗,你的告警呢,不是可以防患未然吗,怕不是绣花枕头……”

啪嗒,啪嗒,啪嗒,小李脸色微红默不出声,但鼠标却一刻未停,扫过几条慢SQL优化建议的界面,心想先找到主要原因再看慢SQL,紧接着不断打开KMonitor的周期性巡检报告、历史趋势走势图,重点关注服务器资源的监控情况,虽然CPU处在60%的较高占用率上,内存剩余也仅剩10G,但从历史走势来看CPU内存使用情况一直如此还是比较平稳的。这时一条硬盘S.M.A.R.T告警信息印入眼帘,小李赶紧点击查看详情,C5警报,C5计数为12,C5是当前待映射扇区数量,说明硬盘某些扇区出现了问题,可能读取异常也可能是写入异常。小李心里慢慢捋了下思路,数据库收到应用系统的SQL请求时缓存未命中,数据库会从物理文件加载数据,大概是因为某个表文件存储在这些不正常的扇区上,读到了错误的值,错误数据传递到了应用系统,从而造成了新增黄码警告。

小李急忙打开硬盘S.M.A.R.T历史记录,早在两天前C5就已经告警了,按道理说两天前就会有短信、电话告警呀,他点开告警设置界面,喃喃道“张强是告警接收人,他是……”

他被隔离了,有密切接触历史,应该还在方舱医院。”旁边的IT主管不解道,“他会收到这个告警吗,告警了怎么处理?”

小李解释说:“收到告警需要具体问题具体分析,向这种硬盘告警是比较严重的问题的,会有电话通知的,被隔离了可能顾不上看手机,这些告警被忽略后就会造成了今天的结果,读出了错误的数据……KMonitor是可以设置多级告警的,可以设置多个告警接收人……”

“先把我加到名单里吧”,IT主管悬着的心算是稍稍落下些。

至此,真相大白,IT主管喊来硬件供应商,小李按照公司的备份恢复最佳实践,制定了数据恢复方案,大家齐心协力将完整数据恢复到了全新的硬盘上去,经过一天一夜的忙碌,整个系统再次回归了正常。

白墙上的挂钟再次走向了四点钟,大家望着灰蒙蒙的窗外,隐约看到一辆警车拐到了另一个路口,疫情下的城市有不少的故事,有太多的默默无闻的战斗在第一线的奉献者们,当然也有无声的功勋之数据库管家KMonitor在守候着,正可谓是:

实时监控全状态,异常情况即告警,防患未然保平安,性能调优赛专家

无声的功勋之数据库管家KMonitor相关推荐

  1. ADODB类库——数据库管家

    最近接手一个新型超大型项目,发现里面链接数据库时使用的时ADODB类库,百度了一番,发现它好比数据库管家,它可以链接多种类型数据库,比如mysql.server.pagesql等等其他数据库,这种数据 ...

  2. 数据库管家----ADODB类库.

    虽然php是构建web的强有力工具,但是由于php的存储函数并没有标准化.这导致在不同数据库间的函数名称和参数有很大的差异,更换数据库也将带来大量的代码修复工作.adodb类库就是为了解决这个问题而产 ...

  3. ADODB类库——数据库管家(一)

    ADODB类库为一PHP访问数据库定义了一个轻量级.一致性的借口,它提供了一个数据访问抽象层.这样无论使用什么样的数据库,都可以通过一致性的函数执行查询和获取数据. ADODB中需要重点掌握的函数 名 ...

  4. KingbaseES数据库概念(一)--数据库简介

    1. 金仓数据库的发展历史 KingbaseES数据库是人大金仓自主研发的一种通用关系型数据库,产品融合了人大金仓在数据库领域几十年的产品研发和企业级应用经验,可满足各行业用户多种场景的数据处理需求. ...

  5. 【职场心路】一个老DBA的自白

    杨志洪[DBA+社群]创始人 [DBA+社群]上海发起人 数据管理专家,Oracle ACE.OCM. SHOUG/ZJOUG核心成员.DAMA会员/CCF会员,译著<Oracle核心技术> ...

  6. 9206 课堂笔记 综合演练 添加数据与非空验证

    操作的数据目标 主窗体的需求 mdi窗体 菜单栏,新建数据,查询数据 主窗体设置mdi窗体 设置菜单栏 点击新增数据,弹出新窗体 绘制界面 通过代码让这个窗体显示出来 添加一个mdi的效果 让新窗体作 ...

  7. 读书与技术 之一:王飞鹏老师DB2系列书籍

    对于技术学习来说,是由理论学习和实际操作两个方面,在这两个方面的学习过程中,了解.学习.借鉴一些业内"大牛"的经历和思路对于自己的学习提高是非常有好处的. 通过自己的经验,需要想要 ...

  8. Spring Boot参考指南

    Spring Boot参考指南 作者 菲利普·韦伯,戴夫 Syer,约什 长,斯特凡 尼科尔,罗布 绞车,安迪·威尔金森,马塞尔 Overdijk,基督教 杜普伊斯,塞巴斯蒂安·德勒兹,迈克尔·西蒙斯 ...

  9. 行云管家 V4.7产品新特性-国际化版本、支持Oracle的数据库审计、主机密码自动修改策略 发布日期:2018-11-22...

    行云管家在线体验: 行云管家[官网]-领先的云计算管理平台-云安全,堡垒机,自动化运维​ 行云管家新手有礼活动: 行云管家新手有礼,新用户1元即可体验专业版-优惠券​ 发布日期:2018-11-22 ...

最新文章

  1. C# 使用HttpWebRequest通过PHP接口 上传文件
  2. org.apache.kafka.common.errors.TimeoutException: Topic not present in metadata 解决方法
  3. python 解方程 sympy_用Python和Sympy求解方程并得到数值答案
  4. web Worker简介、web Worker报错分析、作用
  5. POJ 2923 Relocation ★(状态压缩+01背包)
  6. 永久使用卡巴斯基的方法
  7. Vue电影网站构建实战教程
  8. php thrift 编译,Thrift 源码编译
  9. Win10常用快捷键总结
  10. maven设置阿里仓库
  11. postgresql 事务隔离级别 set transaction isolation level
  12. Docker启动了Mysql命令行连不上报access denied for user ‘sy-fjj-web‘@‘localhost‘ (using password: YES)
  13. 喜马拉雅xm格式转化mp3_如何把喜马拉雅音频改为mp3格式
  14. 浅谈AutoCAD下载安装的那些三两事!
  15. Windows卡死问题分析
  16. Tableau培训学习笔记3:空间数据分析——科比投篮以及新冠肺炎分析(带数据)
  17. c语言 矩阵转置_C语言中的矩阵转置
  18. 企业如何运用MES管理系统破除生产暗箱,打造透明化工厂?
  19. 修复android 5.0 Xutils的框架问题retry error, curr request is null
  20. Unity3D模型制作规范(转载)

热门文章

  1. 淘宝最勤奋主播:每天直播两场,时长常达6-8小时
  2. 简单讲解c语言中各个输入输出函数使用场景与不同,填补你的知识盲区
  3. 10分钟快速集成360 RePlugin
  4. 2021.3.8-2021.3.14周报
  5. JavaScript算法——桶排序
  6. 使用Cool-Admin搭建药房项目(1.1)
  7. 打游戏最快的计算机,打游戏最好的笔记本电脑是哪一款-散热迅速运行流畅笔记本电脑大全...
  8. 高通5G智能平台概述
  9. 【量子计算】如何实现一个量子比特
  10. 宝妈怎么找副业?如何寻找副业兼职?