一、难题简述:

Nginx网络服务器,HP,有沉余,在其中一台网络服务器mcelog负荷较为高,日志秒等级,早已危害了此网络服务器业务流程。

tail -f /var/log/mcelog

#留意看此信息是持续循环系统,留意看

Transaction:Memory scrubbing error

MemCtrl:Corrected patrol scrub error

Erroroverflow

Corrected  error

#留意看其他信息

CPU16 BANK 9

MCE11

337335    MCi_MISCregister valid

337336    MCi_ADDRregister valid

337337    MCA:MEMORY CONTROLLER MS_CHANNEL1_ERR

337338    Transaction:Memory scrubbing error

337339    MemCtrl:Corrected patrol scrub error

337340

337341    STATUScc0048c0000800c1 MCGSTATUS 0

337342    MCGCAP1000812 APICID 8 SOCKETID 0

337343    CPUIDVendor Intel Family 6 Model 45

337344    Hardwareevent. This is not a software error.

337345    MCE10

337346    CPU16 BANK 9

337347    MISC90011000010008c ADDR 15e0e2000

337348    TIME1495308194 Sun May 21 03:23:14 2017

337349    MCGstatus:

337350    MCistatus:

337351    Erroroverflow

337352    Correctederror

337353    MCi_MISCregister valid

337354    MCi_ADDRregister valid

337355    MCA:MEMORY CONTROLLER MS_CHANNEL1_ERR

337356    Transaction:Memory scrubbing error

337357    MemCtrl:Corrected patrol scrub error

337358

337359    STATUScc0003c0000800c1 MCGSTATUS 0

337360    MCGCAP1000812 APICID 9 SOCKETID 0

337361    CPUIDVendor Intel Family 6 Model 45

337362    Hardwareevent. This is not a software error.

337363    MCE11

337364    CPU17 BANK 9

337365    MISC90011000010008c ADDR 15e0f8000

337366    TIME1495308194 Sun May 21 03:23:14 2017

337367    MCGstatus:

337368    MCistatus:

337369    Erroroverflow

337370    Correctederror

tail -f /var/log/messages

二、mcelog简易表明

2.1)mcelog此服务是什么?

查验硬件配置不正确,尤其是内存和CPU不正确的专用工具

2.2)mcelog工作模式?

cron  trigger (高效率高矮难题)

daemon (centos现阶段方式) 默认设置日志打进/var/log/mcelog

2.3)mcelog安裝

yum install mcelog or 编译程序就可以。

三、问题分析:

3.1)error信息:

Transaction:Memory scrubbing error

MemCtrl:Corrected patrol scrub error

Erroroverflow

Corrected  error

留意,根据上边的出错信息能够分辨内存很有可能出了难题,由于mcelog日志出错,则很可能是硬件配置信息常见故障。

3.2)其他信息

MCE(Machine Check Exception)是一类计算机系统不正确。很有可能缘故有:

内存出错,内存缓存文件常见故障,cpu常见故障,也很有可能和电脑主板,系统总线有关系。

CPU16 BANK 9

CPU 17 BANK 9  ...

bank界定:

传统式内存系统软件为了更好地确保CPU的一切正常工作中,务必一次传送完CPU在一个传送周期时间内所必须的数据信息。而CPU在一个传送周期时间能接受的数据信息容积便是CPU系统总线的位宽,企业是bit(位)。内存与CPU中间的数据传输根据电脑主板上的北桥芯片开展,内存系统总线的数据信息位宽相当于CPU系统总线的位宽,这一位宽就称作物理学Bank。

bank:一直想根据bank和上边日志,清查很有可能哪一个扩展槽有什么问题。这儿期待大伙儿给与提醒。

3.3)查询网络服务器各显示灯:

一切正常。(这儿很出现意外,但是假如难题刚造成没多久,显示灯也不会立刻出难题)

3.4)资询盆友

提议:一般硬件配置出了难题,提议换内存,备份数据数据信息等。

四、解决次序(renzhiyuan.blog.51cto.com)

4.1)先光滑转移业务流程确保业务流程一切正常运作。

4.2)备份数据数据信息,并保证 数据信息的易用性。

4.3)切忌重新启动,先试着清晰内存缓存文件,inode,文件目录。清除缓存文件难题。

4.4)假如负荷很高,可考虑到关掉mcelog服务项目。

4.5)hp服务器有硬件配置剖析作用,可先清查。

4.6)提前准备同样规格型号内存条,试着拆换内存条(最好是不要动每一个内存本来的部位,一般内存并不是许多 ,可尝      试,如果能分辨哪一个扩展槽出难题,可先更换)

4.7)假如拆换内存条失效,则很有可能其他硬件配置难题,考虑到检修解决。

4.8)之上全部进展和結果,做办理备案,并立即和领导干部体现。

热搜词

电脑显示服务器负载信息失败,线上服务mcelog负载异常分析处理流程相关推荐

  1. 服务器负载信息失败,网络故障分析案例:负载均衡系统造成网络业务访问失败...

    许多企事业单位的核心业务系统通常对稳定性.性能和扩展性有很高的要求.应用负载均衡设备通过对服务器建立有效的健康检查和负载均衡机制,提供一种高性价比.透明的容错方法扩容网络设备和服务器的带宽.吞吐量和数 ...

  2. itools电脑显示服务器维护,iTools无法打开且服务无法启动怎么解决?-电脑自学网...

    相信大家都知道,如果想要在电脑上面连接管理苹果手机,那么就需要先安装iTools工具.但是有时候却会遇到iTools无法打开且服务无法启动的情况,那么遇到这个情况该如何解决呢? 解决方法一: 1.安装 ...

  3. 线上服务CPU100%问题快速定位实战--转

    来自微信公众号 架构师之路 功能问题,通过日志,单步调试相对比较好定位. 性能问题,例如线上服务器CPU100%,如何找到相关服务,如何定位问题代码,更考验技术人的功底. 58到家架构部,运维部,58 ...

  4. 线上服务CPU100%问题快速定位实战(转载公众号:架构师之路)

    功能问题,通过日志,单步调试相对比较好定位. 性能问题,例如线上服务器CPU100%,如何找到相关服务,如何定位问题代码,更考验技术人的功底. 58到家架构部,运维部,58速运技术部联合进行了一次线上 ...

  5. java 定时_Java线上定时任务不定期挂掉问题分析

    作者:IKNOW本尊 问题背景 收到频繁的告警邮件,定时任务调度失败,查看xxl-job的执行器列表是空的,但是服务又显示健康,查看历史任务执行记录发现执行器是依次递减,由于是线上服务,只能先重启,然 ...

  6. 线上服务CPU100%问题快速定位实战

    功能问题,通过日志,单步调试相对比较好定位. 性能问题,例如线上服务器CPU100%,如何找到相关服务,如何定位问题代码,更考验技术人的功底. 58到家架构部,运维部,58速运技术部联合进行了一次线上 ...

  7. 一次线上服务CPU100%的排查过程

    前言 突然收到线上服务cpu达到100%的报警短信,于是立即展开排查. 排查过程 理论步骤 一.找到最耗CPU的进程 工具:top 方法: 执行top -c ,显示进程运行信息列表 键入P (大写p) ...

  8. 线上服务Java进程假死快速排查、分析

    线上服务Java进程假死快速排查.分析 最近我们有一台服务器上的Java进程总是在运行个两三天后就无法响应请求了,具体现象如下: 请求业务返回状态码502,查看进程还在,意味着Java进程假死,无法响 ...

  9. 线上服务CPU100%问题快速定位实战(58沈剑)

    功能问题,通过日志,单步调试相对比较好定位. 性能问题,例如线上服务器CPU100%,如何找到相关服务,如何定位问题代码,更考验技术人的功底. 58到家架构部,运维部,58速运技术部联合进行了一次线上 ...

最新文章

  1. Python学习全家桶,Python初学者十一个热门问题
  2. WISEGATE:SIEM的最佳实践讨论
  3. embedding 层的详细解释
  4. 【转】NAST表的使用
  5. set集合判断集合中是否有无元素_集合 (Set) | 一山不容二虎的 Python 数据类型
  6. Windows Store Javascript项目使用高德地图、谷歌地图、百度地图API
  7. 2020年1月数据库流行度排行:从万里挑二到波澜不惊
  8. 16软件1班安卓第二学期学习总结
  9. mybatis 显示 sql日志
  10. c语言全文件操作函数,C语言文件操作函数大全
  11. opencv 绘制图像直方图,实现直方图均衡化
  12. python kafka kerberos 验证 消费 生产
  13. 微信小游戏跳坑之旅(一)——使用白鹭引擎开发之创建项目
  14. adb工具包的安装和使用(Windows)
  15. 联想键盘sk8821的Fn功能键
  16. STM32F407与CS5531、CS5532、CS5533、CS5534通信程序解析
  17. 拉格朗日插值一个公式概括
  18. WPS2003排版位置错误一例(转)
  19. 5v继电器模块实物接线_继电器实物接线图
  20. 物联网开发笔记(9)- 使用Wokwi仿真MicroPython on ESP32开发板实现温度和湿度检测并使用屏幕显示

热门文章

  1. Html5与CSS3权威指南 百度云下载
  2. java 异常 检查型和非检查型
  3. Silverlight4Beta之与剪切板通信
  4. Flutter 页面托动按钮 DraggableFloatingActionButton
  5. Mr.J-- jQuery学习笔记(十四)--动画显示隐藏
  6. shutil——高级的 文件、文件夹、压缩包 处理模块
  7. 201621123058 《java课程设计》第九周学习总结
  8. POJ 1947 Rebuilding Roads (树dp + 背包思想)
  9. SPI、I2C、UART三种串行总线协议的区别和SPI接口介绍(转)
  10. hibernate中的一对多和多对多的映射关系