电脑显示服务器负载信息失败,线上服务mcelog负载异常分析处理流程
一、难题简述:
Nginx网络服务器,HP,有沉余,在其中一台网络服务器mcelog负荷较为高,日志秒等级,早已危害了此网络服务器业务流程。
tail -f /var/log/mcelog
#留意看此信息是持续循环系统,留意看
Transaction:Memory scrubbing error
MemCtrl:Corrected patrol scrub error
Erroroverflow
Corrected error
#留意看其他信息
CPU16 BANK 9
MCE11
337335 MCi_MISCregister valid
337336 MCi_ADDRregister valid
337337 MCA:MEMORY CONTROLLER MS_CHANNEL1_ERR
337338 Transaction:Memory scrubbing error
337339 MemCtrl:Corrected patrol scrub error
337340
337341 STATUScc0048c0000800c1 MCGSTATUS 0
337342 MCGCAP1000812 APICID 8 SOCKETID 0
337343 CPUIDVendor Intel Family 6 Model 45
337344 Hardwareevent. This is not a software error.
337345 MCE10
337346 CPU16 BANK 9
337347 MISC90011000010008c ADDR 15e0e2000
337348 TIME1495308194 Sun May 21 03:23:14 2017
337349 MCGstatus:
337350 MCistatus:
337351 Erroroverflow
337352 Correctederror
337353 MCi_MISCregister valid
337354 MCi_ADDRregister valid
337355 MCA:MEMORY CONTROLLER MS_CHANNEL1_ERR
337356 Transaction:Memory scrubbing error
337357 MemCtrl:Corrected patrol scrub error
337358
337359 STATUScc0003c0000800c1 MCGSTATUS 0
337360 MCGCAP1000812 APICID 9 SOCKETID 0
337361 CPUIDVendor Intel Family 6 Model 45
337362 Hardwareevent. This is not a software error.
337363 MCE11
337364 CPU17 BANK 9
337365 MISC90011000010008c ADDR 15e0f8000
337366 TIME1495308194 Sun May 21 03:23:14 2017
337367 MCGstatus:
337368 MCistatus:
337369 Erroroverflow
337370 Correctederror
tail -f /var/log/messages
二、mcelog简易表明
2.1)mcelog此服务是什么?
查验硬件配置不正确,尤其是内存和CPU不正确的专用工具
2.2)mcelog工作模式?
cron trigger (高效率高矮难题)
daemon (centos现阶段方式) 默认设置日志打进/var/log/mcelog
2.3)mcelog安裝
yum install mcelog or 编译程序就可以。
三、问题分析:
3.1)error信息:
Transaction:Memory scrubbing error
MemCtrl:Corrected patrol scrub error
Erroroverflow
Corrected error
留意,根据上边的出错信息能够分辨内存很有可能出了难题,由于mcelog日志出错,则很可能是硬件配置信息常见故障。
3.2)其他信息
MCE(Machine Check Exception)是一类计算机系统不正确。很有可能缘故有:
内存出错,内存缓存文件常见故障,cpu常见故障,也很有可能和电脑主板,系统总线有关系。
CPU16 BANK 9
CPU 17 BANK 9 ...
bank界定:
传统式内存系统软件为了更好地确保CPU的一切正常工作中,务必一次传送完CPU在一个传送周期时间内所必须的数据信息。而CPU在一个传送周期时间能接受的数据信息容积便是CPU系统总线的位宽,企业是bit(位)。内存与CPU中间的数据传输根据电脑主板上的北桥芯片开展,内存系统总线的数据信息位宽相当于CPU系统总线的位宽,这一位宽就称作物理学Bank。
bank:一直想根据bank和上边日志,清查很有可能哪一个扩展槽有什么问题。这儿期待大伙儿给与提醒。
3.3)查询网络服务器各显示灯:
一切正常。(这儿很出现意外,但是假如难题刚造成没多久,显示灯也不会立刻出难题)
3.4)资询盆友
提议:一般硬件配置出了难题,提议换内存,备份数据数据信息等。
四、解决次序(renzhiyuan.blog.51cto.com)
4.1)先光滑转移业务流程确保业务流程一切正常运作。
4.2)备份数据数据信息,并保证 数据信息的易用性。
4.3)切忌重新启动,先试着清晰内存缓存文件,inode,文件目录。清除缓存文件难题。
4.4)假如负荷很高,可考虑到关掉mcelog服务项目。
4.5)hp服务器有硬件配置剖析作用,可先清查。
4.6)提前准备同样规格型号内存条,试着拆换内存条(最好是不要动每一个内存本来的部位,一般内存并不是许多 ,可尝 试,如果能分辨哪一个扩展槽出难题,可先更换)
4.7)假如拆换内存条失效,则很有可能其他硬件配置难题,考虑到检修解决。
4.8)之上全部进展和結果,做办理备案,并立即和领导干部体现。
热搜词
电脑显示服务器负载信息失败,线上服务mcelog负载异常分析处理流程相关推荐
- 服务器负载信息失败,网络故障分析案例:负载均衡系统造成网络业务访问失败...
许多企事业单位的核心业务系统通常对稳定性.性能和扩展性有很高的要求.应用负载均衡设备通过对服务器建立有效的健康检查和负载均衡机制,提供一种高性价比.透明的容错方法扩容网络设备和服务器的带宽.吞吐量和数 ...
- itools电脑显示服务器维护,iTools无法打开且服务无法启动怎么解决?-电脑自学网...
相信大家都知道,如果想要在电脑上面连接管理苹果手机,那么就需要先安装iTools工具.但是有时候却会遇到iTools无法打开且服务无法启动的情况,那么遇到这个情况该如何解决呢? 解决方法一: 1.安装 ...
- 线上服务CPU100%问题快速定位实战--转
来自微信公众号 架构师之路 功能问题,通过日志,单步调试相对比较好定位. 性能问题,例如线上服务器CPU100%,如何找到相关服务,如何定位问题代码,更考验技术人的功底. 58到家架构部,运维部,58 ...
- 线上服务CPU100%问题快速定位实战(转载公众号:架构师之路)
功能问题,通过日志,单步调试相对比较好定位. 性能问题,例如线上服务器CPU100%,如何找到相关服务,如何定位问题代码,更考验技术人的功底. 58到家架构部,运维部,58速运技术部联合进行了一次线上 ...
- java 定时_Java线上定时任务不定期挂掉问题分析
作者:IKNOW本尊 问题背景 收到频繁的告警邮件,定时任务调度失败,查看xxl-job的执行器列表是空的,但是服务又显示健康,查看历史任务执行记录发现执行器是依次递减,由于是线上服务,只能先重启,然 ...
- 线上服务CPU100%问题快速定位实战
功能问题,通过日志,单步调试相对比较好定位. 性能问题,例如线上服务器CPU100%,如何找到相关服务,如何定位问题代码,更考验技术人的功底. 58到家架构部,运维部,58速运技术部联合进行了一次线上 ...
- 一次线上服务CPU100%的排查过程
前言 突然收到线上服务cpu达到100%的报警短信,于是立即展开排查. 排查过程 理论步骤 一.找到最耗CPU的进程 工具:top 方法: 执行top -c ,显示进程运行信息列表 键入P (大写p) ...
- 线上服务Java进程假死快速排查、分析
线上服务Java进程假死快速排查.分析 最近我们有一台服务器上的Java进程总是在运行个两三天后就无法响应请求了,具体现象如下: 请求业务返回状态码502,查看进程还在,意味着Java进程假死,无法响 ...
- 线上服务CPU100%问题快速定位实战(58沈剑)
功能问题,通过日志,单步调试相对比较好定位. 性能问题,例如线上服务器CPU100%,如何找到相关服务,如何定位问题代码,更考验技术人的功底. 58到家架构部,运维部,58速运技术部联合进行了一次线上 ...
最新文章
- Python学习全家桶,Python初学者十一个热门问题
- WISEGATE:SIEM的最佳实践讨论
- embedding 层的详细解释
- 【转】NAST表的使用
- set集合判断集合中是否有无元素_集合 (Set) | 一山不容二虎的 Python 数据类型
- Windows Store Javascript项目使用高德地图、谷歌地图、百度地图API
- 2020年1月数据库流行度排行:从万里挑二到波澜不惊
- 16软件1班安卓第二学期学习总结
- mybatis 显示 sql日志
- c语言全文件操作函数,C语言文件操作函数大全
- opencv 绘制图像直方图,实现直方图均衡化
- python kafka kerberos 验证 消费 生产
- 微信小游戏跳坑之旅(一)——使用白鹭引擎开发之创建项目
- adb工具包的安装和使用(Windows)
- 联想键盘sk8821的Fn功能键
- STM32F407与CS5531、CS5532、CS5533、CS5534通信程序解析
- 拉格朗日插值一个公式概括
- WPS2003排版位置错误一例(转)
- 5v继电器模块实物接线_继电器实物接线图
- 物联网开发笔记(9)- 使用Wokwi仿真MicroPython on ESP32开发板实现温度和湿度检测并使用屏幕显示
热门文章
- Html5与CSS3权威指南 百度云下载
- java 异常 检查型和非检查型
- Silverlight4Beta之与剪切板通信
- Flutter 页面托动按钮 DraggableFloatingActionButton
- Mr.J-- jQuery学习笔记(十四)--动画显示隐藏
- shutil——高级的 文件、文件夹、压缩包 处理模块
- 201621123058 《java课程设计》第九周学习总结
- POJ 1947 Rebuilding Roads (树dp + 背包思想)
- SPI、I2C、UART三种串行总线协议的区别和SPI接口介绍(转)
- hibernate中的一对多和多对多的映射关系