linux内存条故障,linux – 如何从MCE消息中找到故障内存模块?
我试图了解MCE消息,以找出服务器上哪个内存模块坏.此消息出现在/var/log/kern.log中的一台服务器中,今天冻结了两次.
Apr 13 22:39:22 mBox kernel: [36247975.116860] sbridge: HANDLING MCE MEMORY ERROR
Apr 13 22:39:22 mBox kernel: [36247975.116867] cpu 0: Machine Check Exception: 0 Bank 5: 8c00004000010090
Apr 13 22:39:22 mBox kernel: [36247975.116869] TSC 0 ADDR 4a0d75900 MISC 21405cdc86 PROCESSOR 0:206d7 TIME 1428957562 SOCKET 0 APIC 0
Apr 13 22:39:22 mBox kernel: [36247975.951013] EDAC MC0: 1 CE memory read error
我怀疑一个坏的内存模块.服务器是2x Xeon E5-2650,带有8x8Go内存模块(每个cpu有8个内存插槽)
这是lshw的内存模块数量:
*-memory:0
description: System Memory
physical id: 2d
slot: System board or motherboard
*-bank:0
description: DIMM DDR3 1333 MHz (0,8 ns)
product: 9965516-197.A
vendor: Kingston
physical id: 0
serial: B83AE5C2
slot: P1_DIMMA1
size: 8GiB
width: 64 bits
clock: 1333MHz (0.8ns)
*-bank:1
description: DIMM Synchronous [empty]
product: Dimm1_PartNum
vendor: Dimm1_Manufacturer
physical id: 1
serial: Dimm1_SerNum
slot: P1_DIMMA2
width: 64 bits
*-bank:2
description: DIMM DDR3 1333 MHz (0,8 ns)
product: 9965516-048.A
vendor: Kingston
physical id: 2
serial: EC309238
slot: P1_DIMMB1
size: 8GiB
width: 64 bits
clock: 1333MHz (0.8ns)
*-bank:3
description: DIMM Synchronous [empty]
product: Dimm4_PartNum
vendor: Dimm4_Manufacturer
physical id: 3
serial: Dimm4_SerNum
slot: P1_DIMMB2
width: 64 bits
*-bank:4
description: DIMM DDR3 1333 MHz (0,8 ns)
product: 9965516-048.A
vendor: Kingston
physical id: 4
serial: E9305438
slot: P1_DIMMC1
size: 8GiB
width: 64 bits
clock: 1333MHz (0.8ns)
*-bank:5
description: DIMM Synchronous [empty]
product: Dimm7_PartNum
vendor: Dimm7_Manufacturer
physical id: 5
serial: Dimm7_SerNum
slot: P1_DIMMC2
width: 64 bits
*-bank:6
description: DIMM DDR3 1333 MHz (0,8 ns)
product: 9965516-048.A
vendor: Kingston
physical id: 6
serial: E7305738
slot: P1_DIMMD1
size: 8GiB
width: 64 bits
clock: 1333MHz (0.8ns)
*-bank:7
description: DIMM Synchronous [empty]
product: Dimm10_PartNum
vendor: Dimm10_Manufacturer
physical id: 7
serial: Dimm10_SerNum
slot: P1_DIMMD2
width: 64 bits
*-memory:1
description: System Memory
physical id: 3f
slot: System board or motherboard
*-bank:0
description: DIMM DDR3 1333 MHz (0,8 ns)
product: 9965516-197.A
vendor: Kingston
physical id: 0
serial: B63A08C3
slot: P2_DIMME1
size: 8GiB
width: 64 bits
clock: 1333MHz (0.8ns)
*-bank:1
description: DIMM Synchronous [empty]
product: Dimm1_PartNum
vendor: Dimm1_Manufacturer
physical id: 1
serial: Dimm1_SerNum
slot: P2_DIMME2
width: 64 bits
*-bank:2
description: DIMM DDR3 1333 MHz (0,8 ns)
product: 9965516-048.A
vendor: Kingston
physical id: 2
serial: EA309638
slot: P2_DIMMF1
size: 8GiB
width: 64 bits
clock: 1333MHz (0.8ns)
*-bank:3
description: DIMM Synchronous [empty]
product: Dimm4_PartNum
vendor: Dimm4_Manufacturer
physical id: 3
serial: Dimm4_SerNum
slot: P2_DIMMF2
width: 64 bits
*-bank:4
description: DIMM DDR3 1333 MHz (0,8 ns)
product: 9965516-048.A
vendor: Kingston
physical id: 4
serial: E7305938
slot: P2_DIMMG1
size: 8GiB
width: 64 bits
clock: 1333MHz (0.8ns)
*-bank:5
description: DIMM Synchronous [empty]
product: Dimm7_PartNum
vendor: Dimm7_Manufacturer
physical id: 5
serial: Dimm7_SerNum
slot: P2_DIMMG2
width: 64 bits
*-bank:6
description: DIMM DDR3 1333 MHz (0,8 ns)
product: 9965516-048.A
vendor: Kingston
physical id: 6
serial: E7305B38
slot: P2_DIMMH1
size: 8GiB
width: 64 bits
clock: 1333MHz (0.8ns)
*-bank:7
description: DIMM Synchronous [empty]
product: Dimm10_PartNum
vendor: Dimm10_Manufacturer
physical id: 7
serial: Dimm10_SerNum
slot: P2_DIMMH2
width: 64 bits
*-memory:2 UNCLAIMED
physical id: 7
*-memory:3 UNCLAIMED
physical id: 9
您可以注意到,#5银行没有内存模块.所以我的问题是:你是否同意这条消息是关于内存故障的?如果是这样,我怎样才能找到要替换的模块?
linux内存条故障,linux – 如何从MCE消息中找到故障内存模块?相关推荐
- 如何在PFSense中设置故障转移和负载平衡
故障转移是一种备份操作模式,仅在主系统由于系统故障或任何计划停机时间而变得不可用时,系统组件(如网络)的操作才由辅助系统承担. 在本教程中,我们将看到如何设置故障转移和负载平衡,以使pfSense能够 ...
- 浅析故障电弧探测器在电气防火中的作用与应用介绍
安科瑞 李雨轩 [摘要]: 分析了重大电气火灾数据.结合目前国内前沿的电气火灾探测技术,重点介绍了故障电弧式电气火灾监控探测器在火灾预警系统中的重要作用,给出了基于多种探测技术的电气火灾监控系统的实现 ...
- AAFD-DU-4G故障电弧探测器在医疗场所中的应用
安科瑞虞佳豪 近年来,医疗电气化程度越来越高,医护人员接触到的 电器设备迅速增加,保障医院安全用电已成为医院乃至全社 会关注的重点.一旦出现安全用电问题,不仅可能会导致医 疗设备无法正常工作,甚至还可 ...
- Linux 下的进程间通信:管道、消息队列、共享文件、共享内存
Table of Contents 无名管道 命名管道 消息队列 共享文件 示例 1. 生产者程序 示例 2. 消费者程序 共享内存 示例 3. memwriter 进程的源程序 示例 4. memr ...
- Linux 环境进程间通信(三):消息队列
本系列文章中的前两部分,我们探讨管道及信号两种通信机制,本文将深入第三部分,介绍系统 V 消息队列及其相应 API. 消息队列(也叫做报文队列)能够克服早期unix通信机制的一些缺点.作为早期unix ...
- linux用函数输出进程信息,进程间通信之-消息队列(Message)--linux内核剖析(十一)...
消息队列 消息队列 (也叫做报文队列)是Unix系统V版本中3种进程间通信机制之一.另外两种是信号量和共享内存. 这些IPC机制使用共同的授权方法.只有通过系统调用将标志符传递给核心之后,进程才能存取 ...
- linux显卡驱动画面抖动,解决显卡引发屏幕抖动故障
最近笔者的一位朋友告诉我说,他的显示器好象遇到什么故障似的,每次开机使用时屏幕总是出现不停抖动现象,严重影响了计算机的正常工作,为此他特意请我帮他检查一下.听完朋友的简单叙述后,笔者首先询问了朋友这台 ...
- linux学习笔记 linux内核6.0.2目录结构
一.linux内核目录 arch 包含和硬件体系结构相关的代码,每种平台占一个相应的目录,如i386.arm.arm64.powerpc.mips等.Linux内核目前已经支持30种左右的体系结构.在 ...
- 鸟哥linux+韩顺平linux视频教程学习小结
linux的特点 优点: 1.免费的/开源的系统 2.支持多线程/多用户的系统 3.安全性好 4.对内存和文件管理优越 linux体积最少只需要内存4M,由于小所以可以做嵌入式开发 缺点: 操作相对困 ...
最新文章
- Python之机器学习K-means算法实现
- 在sublime-text中设置浏览器预览
- JDBC概念快速入门工具类Util的写法
- github star破13k,Dapr 能否引领云原生中间件的未来?
- 玩Linux碰到的问题以及使用技巧总结
- ES6 中的 Set、Map 和 WeakMap
- thymeleaf常用语法
- 微信小程序中base64图片的显示与保存
- 【生活相关】四(C++编程开发学习的50条建议)
- 在树莓派计算模块CM4 eMMC上安装Ubuntu Desktop 21.04
- 【C++】C++11 新特性
- 微信小程序--分享并设置分享链接的有效时间
- 美团新用户0.99充10元话费,秒到账,不实名不绑卡,超简单!
- ORACLE 按时间创建分区表
- Python爬虫 | 以滑雪为例演示大众点评商铺信息采集!
- 计算机游戏快速退出的快捷键,电脑玩游戏怎么快速切回桌面
- 更换固态硬盘(不重装系统)(2)
- Spring的学习之路(必看)
- html5核显加速,英伟达:用GTX 16系列显卡加速,视频编辑速度达核显8倍
- 如何使用iconfont
热门文章
- Zookeeper--客户端操作
- 那个被“爱”刺伤的30岁女孩,在这款游戏里完成了自我“救赎”
- 几何光学学习笔记(23)- 5.6 远心光路
- 如何利用计算机求函数解析式,数据结构表达式求值(计算器)实验报告(共10篇).doc...
- 跨域在前端工程化中的实际解决方案。
- Java的小tips(1) ------关于“Java :找不到符号”类问题的解读
- 大数据运维工作(Linux,OGG,链路监控,Hadoop运维等)
- 斯诺克 Snooker
- sublime3编程c语言,Sublime Text 3 实现C语言代码的编译和运行(示例讲解)
- solid works 插入两两相交直线确定的基准面作图