在同一个集群中,两个从节点 db117,db118 都各出现了1次  “serverStatus was very slow”

db117出现 very slow:

2017-09-14T18:55:49.599+0800 [conn13113916] serverStatus was very slow: { after basic: 0, after asserts: 0, after backgroundFlushing: 0, after connections: 0, after cursors: 0, after dur: 0, after extra_info: 0, after globalLock: 0, after indexCounters: 0, after locks: 0, after network: 0, after opcounters: 0, after opcountersRepl: 0, after recordStats: 1214, after repl: 1214, at end: 1214 }

前后没有出现大的查询(>10秒以上)。其它性能指标也正常。

只是前面看到空间增加了30个 连接。

2017-09-14T18:55:48.157+0800 [initandlisten] connection accepted from 10.116.207.64:57026 #13113915 (264 connections now open)

...................

2017-09-14T18:55:49.551+0800 [initandlisten] connection accepted from 10.174.177.10:64840 #13113946 (295 connections now open)

2017-09-14T18:55:49.599+0800 [conn13113916] serverStatus was very slow:

应该是突然查询数量上来,虽然每个查询的时间不长,但IO,CPU 有个波动的原因。

(但在监控数据中也没看到有突增)

此现象在DB118 中昨天也出现一次,但不是在同时。

2017-09-14T14:12:16.102+0800 [initandlisten] connection accepted from 10.116.207.112:10800 #13301443 (286 connections now open)

..............................................................

2017-09-14T14:12:19.780+0800 [initandlisten] connection accepted from 10.168.168.212:51264 #13301552 (395 connections now open)

2017-09-14T14:12:19.819+0800 [conn13300638] query Mtest.MCard query: { UID: 17433632, Status: 1, MallID: 273 } planSummary: IXSCAN { UID: 1.0, MallID: 1.0 } ntoreturn:1 ntoskip:0 nscanned:1 nscannedObjects:1 keyUpdates:0 numYields:0 locks(micros) r:4079097 nreturned:1 reslen:99 4079ms

2017-09-14T14:12:19.844+0800 [conn13301520] serverStatus was very slow: { after basic: 0, after asserts: 0, after backgroundFlushing: 0, after connections: 0, after cursors: 0, after dur: 0, after extra_info: 0, after globalLock: 0, after indexCounters: 0, after locks: 0, after network: 0, after opcounters: 0, after opcountersRepl: 0, after recordStats: 1516, after repl: 1516, at end: 1526 }

2017-09-14T14:12:19.844+0800 [conn13301520] command admin.$cmd command: serverStatus { serverStatus: 1.0 } keyUpdates:0 numYields:0 locks(micros) r:83 reslen:7456 1557ms

DB118 14:12 时间,IO有一个高峰点,从 2%-->12%。而db117 却没有,问题原因比较难找。

从两次的slow 日志来看,

2017-09-14T14:12:19.844+0800 [conn13301520] serverStatus was very slow: { after basic: 0, after asserts: 0, after backgroundFlushing: 0, after connections: 0, after cursors: 0, after dur: 0, after extra_info: 0, after globalLock: 0, after indexCounters: 0, after locks: 0, after network: 0, after opcounters: 0, after opcountersRepl: 0, after recordStats: 1516, after repl: 1516, at end: 1526 }

慢的原因都在:after recordStats: 1516 ,

也就是说有查询,而内存里没数据,出现了大量的  page faults.

再就是IO ,CPU 有个暂时的繁忙状态。

这两个从节点内存现在为64G,虽然不是很高。但暂时因为业务相对增长比较慢,不会增加内存。

如果有大量的此类预警日志出现,现场可用 mongostat 查看  faults 状态值情况,如果一直都高于 5以上。可以认为是内存不足了。

MongoDb 中 serverStatus was very slow 的原因分析相关推荐

  1. html5不支持的属性,IE9对HTML5中部分属性不支持的原因分析

    这篇文章主要为大家介绍了IE9对HTML5中部分属性不支持的原因分析,对于了解IE9与HTML5的应用有一定帮助作用,需要的朋友可以参考下 本文较为详细的分析了IE9对HTML5中部分属性不支持的原因 ...

  2. 抖音视频服务器维护中暂时无法观看,抖音显示服务器维护中暂时无法观看视频的原因分析...

    最近有不少抖音用户在使用软件的同时遇到一些问题,就是打开抖音发现不能观看视频了,抖音显示服务器维护中暂时无法观看视频这个到底是什么意思?要是抖音服务器维护该怎么办?如何才能涮抖音视频呢?不少小伙伴都有 ...

  3. .net2.0中SqlBulkCopy批量复制数据出错原因分析!

    在项目后台数据库选择SqlServer,进行批量复制数据时,.net2.0中提供的SqlBulkCopy不失为一个好的选择,性能相当可观;最近亲手实验一把,效果不错,大家可以参见http://www. ...

  4. [PCB]PCB光板生产过程中板子弯曲或翘起原因分析

    一.PCB光板板翘是指PCB板面不平坦,出现弯曲和翘起的现象.一般来说,PCB光板板翘的标准应该符合以下要求: 翘起高度:翘起高度是指PCB板面的最高点与基准面之间的距离.一般来说,翘起高度应该小于板 ...

  5. mysql常见慢sql,MySQL中慢SQL的查询及原因分析

    准备数据 查看系统变量 SHOW VARIABLES LIKE 'slow_query%'; slow_query_log:慢sql日志开启状态 slow_query_log_file:慢sql日志存 ...

  6. 脚本中export不起作用的原因分析

    #!bin/bash export PATH=$PATH:/usr/lib/java/jre export PATH=$PATH:/usr/lib/java/bin ---path 结果发现直接运行. ...

  7. android studio clone 方法不能先用,Android Studio中使用git功能无法clone原因分析

    最近在使用git的时候发现一个非常诡异的问题,我用cmd命令行可以进行clone,push,pull等操作时都可以完美的成功,但是换到Android Studio中进行这些与远程库的操作的时候,就是各 ...

  8. SAP中采购提示预算耗竭的原因分析

    在某些项目采购中,通常会用内部订单做预算管理.在采购订单中输入内部订单号来进行关联.这时,当采购订单输入保存时,系统会根据采购订单中行项目的总金额与内部订单中的预算金额进行比较.从而达到预算的目的.在 ...

  9. android listview 刷新数据,ListView中notifyDataSetChanged()刷新数据不更新原因分析

    标题 : 不作死就不会死!!!!!! 类 : ActivityA,ActivityB,BookListAdapter,Book,HttpManager 测试顺序 : ActivityA >> ...

最新文章

  1. Machine learning of neural representations of suicide and emotion concepts identifies suicidal youth
  2. 纽约大学Gary Marcus发文指出AlphaZero「被夸大」,强调重视人工智能「先天因素」
  3. php采集 纠正一下
  4. mongoose框架示例代码解析(一)
  5. AppController
  6. linux python pymysql,Python之pymysql的使用
  7. python数字排列组合去重_排列组合-生成集合的所有子集
  8. 韩国Hana银行将建立试点验证CBDC技术
  9. listview添加item动画
  10. can卡、usbcan、can分析仪通用测试软件LCANTest详细介绍
  11. php怎么安装模板_php 模板框架之smarty 的下载和安装
  12. selenium python怎么断言_请问selenium python 断言怎么写?
  13. 学习 Hybrid Beamforming for Millimeter Wave Systems Using the MMSE Criterion
  14. jsonDB使用手冊
  15. 浅谈FPGA,SoC,ASIC
  16. 【C实现算法00】一个数组中除一个(两个)数只出现一次外其它数字都出现了两次,找出这个数,编程实现。
  17. 【LeetCode】马三来刷题之Remove Duplicates from Sorted Array
  18. 会员管理-小程序-免费使用体验
  19. 解决Windows莫名其妙地从休眠状态唤醒的问题
  20. 合工大计算机与信息学院保研,合肥工业大学计算机与信息学院(专业学位)计算机技术保研夏令营...

热门文章

  1. Index of c#
  2. java之spring mvc之初始spring mvc
  3. 软件工程--第六周学习进度
  4. Linux - chmod
  5. hdu 3401(单调队列优化dp)
  6. jdbc_servlet基础增删改分页2(userinfo表的)
  7. 关于最小化的另辟蹊径
  8. poj 1077 Eight(A*)
  9. Ruby on Rails 實戰聖經阅读(三)
  10. 简化软件产品的实际步骤