硬件维护工具我常用的就2个:倚天剑ipmitool以及屠龙刀MegaCli。今天我们来介绍Ipmitool。注意:Ipmitool是针对硬件底层进行操作管理,对于电源相关的操作请三思!

1. IPMI简介

IPMI (intelligent platform management interface)智能平台管理接口是一种开放标准的硬件管理接口规格 ,定义了嵌入式管理子系统进行通信的特方法。IPMI信息通过基板管理控制器 (BMC)(位于 IPMI规格的硬件组上)进行交流。使用低级智能管理而不使用操作系统 进行管理, 用户可以利用IPMI监视服务器的物理健康状态,如温度、电压、风扇工作状态、电源状态等。

2. IPMI优点

IPMI 把系统管理软件从系统的硬件平台管理任务中分离出来,并且把底层的服务器管理功能与高层软件分开。这样,推出一个通用的、跨系统的平台管理监控软件就成为可能;
IPMI 是可扩展的并且能够快速简单地在其上附加新功能,如增加更多的传感器、管理控制器或特定的配件设备;
在加入IPMI 技术的系统里,CPU 只需要与IPMI 就事件进行通信,形成IPMI 事件记录(Event Log)。在系统上的每个设备直接通过IPMI 与事件记录文件通信,而事件记录文件以统一的方法为每个特定的设备记录所有的事件状态。这一特点进一步简化了代理(Agent)的处理任务,提高了系统的整体运行性能。

3. IPMI工作原理

IPMI 的核心是基板管理控制器(BMC),其并不依赖于服务器的处理器、BIOS 或操作系统来工作,可谓非常地独立,是一个单独在系统内运行的无代理管理子系统,只要有BMC 与IPMI 固件其便可开始工作,而BMC 通常是一个安装在服务器主板上的独立的板卡,现在也有服务器主板提供对IPMI 支持的。IPMI 良好的自治特性便克服了以往基于操作系统的管理方式所受的限制,例如操作系统不响应或未加载的情况下其仍然可以进行开关机、信息提取等操作。

在工作时,所有的IPMI 功能都是向BMC 发送命令来完成的,命令使用IPMI 规范中规定的指令,BMC 接收并在系统事件日志中记录事件消息,维护描述系统中传感器情况的传感器数据记录。在需要远程访问系统时,IPMI 的SOL 特性很有用。SOL 改变IPMI 会话过程中本地串口传送方向,从而提供对紧急管理服务、Windows 专用管理控制台或Linux 串行控制台的远程访问。BMC 通过在LAN 上改变传送给串行端口的信息的方向来做到这点,提供了一种与厂商无关的远程查看启动、操作系统加载器或紧急管理控制台来诊断和维修故障的标准方式。

4. BMC的功能

  • 系统的串行端口进行访问
  • 故障日志记录和 SNMP 警报发送
  • 访问系统事件日志 (System Event Log ,SEL) 和传感器状况
  • 控制包括开机和关机
  • 独立于系统电源或工作状态的支持
  • 用于系统设置、基于文本公用程序和操作系统控制台的文本控制台重定向

5. BMC工作原理

BMC 基板管理控制器 (baseboard management controller) 的缩写,这是一个在 IPMI结构下提供智能管理的控制器,BMC 因为多集成于主板而得名,系统管理软件对各个被管理器件的管理,都是通过与BMC 通信来实现的。BMC 通过与主板上的不同传感器通信来监视系统是否有严重事件,并在某些参数超出其预置阈值时发出警报和日志事件。BMC 支持工业标准的 Intelligent Platform Management Interface (IPMI) 协议,可以实现远程配置、监测和恢复系统。BMC 芯片就相当于计算机中的中央处理器,通过BMC 芯片上一对SMBus 接口连接网络,用户可通过网络访问实现对远程服务器接管的带外管理(Out-of-band)功能,例如远程接管服务器(Pre-OS),在客户端实现对远程服务器的完全接管;通过RS-232 接口连接Modem,在远程服务器宕机情况下,用户可以通过拨号访问获取SDR、SEL 数据,分析诊断故障原因;BMC 通过IPMB 接口访问模组风扇背板、电源背板等上的SMC,实现对各种背板的温度电压风扇转速等关键参数管理;BMC 通过系统接口(多用SMIC:ServerManagement Interface Chip),实现IPMI 消息传输机制,控制LCD 显示和实现上层软件与底层F/W 通信,实现告警、数据采集。SDR、SEL、FRU(Field Replacement Unit)物理实体可以是做在芯片内的存储体,也可以是外挂的E2PROM。

BMC 从不同的传感器收集信息,然后可以存到本地的SEL 里面,便于以后查询,也会把重要的信息显示到服务器前面板上面的那个小的LCD 显示器上(需要硬件支持)。同时还能通过网卡(LAN),串口(Serial)、本地(Host)来访问这些信息。

6. Ipmitool的实现方式

6.1 本地调用系统结构图

6.2 远程调用系统结构图

6.3 配置本地啊哦做系统支持IPMI

载入系统功能模块(2.6 kernels):

modprobe ipmi_msghandlermodprobe ipmi_simodprobe ipmi_devintf

注意:必须先载入模块,这样内核才能识别 ipmidev 设备。如果是2.4kernels 载入模块有所区别,请参考文档结尾附录部分。

7. 各品牌服务器对于Ipmitool的支持

如下命令都是在本地调用,如果需要配合远程调用使用,则改为:
ipmitool -I lanplus -H $ILO_IP -U $USERNAME -P $PASSWORD XXXXXXXX

8、坑—客户端无法获取dell机器的mac信息

现象无法远程获取dell机型的mac地址信息

#ipmitool -I lanplus -U $ILO_USER -P $ILO_PW -H $ILO_IP delloem mac get 1

Error in getting MAC Address : Not supported platform

经过多次测试,对比不同服务器的系统版本,ipmitool版本以及,IDRAC固件版本后发现是客户端的ipmitool的版本问题

9、坑—SOL定向出现乱码

在启动的各个阶段都能够正常显示,一到登录界面,就出现乱码.

故障原因:配置不同

/etc/inittab文件配置不同 S0:12345:respawn:/sbin/agetty -L 57600 ttyS1 vt102

/boot/grub/menu.lst文件配置不同 未注释掉splashimage图形显示

原文来自:http://www.yunweipai.com/archives/19236.html

接口本地正常服务器报500_运维该如何解决服务器底层维护难题?相关推荐

  1. linux cpu不足处理运维,Linux运维知识之Linux服务器CPU占用率较高问题排查思路

    本文主要向大家介绍了Linux运维知识之Linux服务器CPU占用率较高问题排查思路,通过具体的内容向大家展现,希望对大家学习Linux运维知识有所帮助. 注意:本文相关配置及说明已在 CentOS  ...

  2. 阿里技术实战:数十万云服务器如何高效运维?

    上云后需要运维吗?答案是:当然需要. 上云确实简化了一部分的运维工作,比如传统IT中服务器的日常运维等工作都交由云服务商来完成了.但随着云上产品种类的不断丰富和规模的不断扩大,云上资源如何高效运维正逐 ...

  3. 机房服务器的简单运维

    机房的服务器的维护是机房运维工作的重点,如何保证服务器随时保持最佳状态,如何通过一些简单的维护来提高服务器的寿命和更快的速度?我们一起来探讨一下机房服务器的简单运维方法. 1.关于电力 (1)定期检测 ...

  4. Postman请求linux服务器报错:503Forwarding failure,由于服务器端口未开放;服务器端口开放与关闭

    Postman请求linux服务器报错:503Forwarding failure,由于服务器端口未开放:服务器端口开放与关闭 文章目录: 1 问题分析 2 在Centos上开启和关闭端口 2.1 C ...

  5. linux系统python截图不显示中文_Linux运维知识之解决linux系统下python中的matplotlib模块内的pyplot输出图片不能显示中文的问题...

    本文主要向大家介绍了Linux运维知识之解决linux系统下python中的matplotlib模块内的pyplot输出图片不能显示中文的问题,通过具体的内容向大家展现,希望对大家学习Linux运维知 ...

  6. linux crontab不运行,Linux运维知识之解决Linux中crontab不执行ntpdate问题

    本文主要向大家介绍了Linux运维知识之解决Linux中crontab不执行ntpdate问题,通过具体的内容向大家展现,希望对大家学习Linux运维知识有所帮助. 解决Linux中crontab尚未 ...

  7. linux sudo 命令无法使用,Linux运维知识之解决Linux下无法使用sudo命令问题

    本文主要向大家介绍了Linux运维知识之解决Linux下无法使用sudo命令问题,通过具体的内容向大家展现,希望对大家学习Linux运维知识有所帮助. 问题描述 使用普通用户登录后在终端中执行sudo ...

  8. 接口本地正常服务器报500_对接口的理解与接口测试的意义

    一.接口的定义: 1.接口是前后端沟通的桥梁,是数据传输通道,包括外部接口.内部接口,内部接口又包括:上层服务与下层服务接口.同级接口. 2.接口是把自己提供给外界的一种抽象化物,使其能被内部修改而不 ...

  9. 六个人如何运维一万台服务器?

    我 2013 年加入去哪儿网,一直在从事运维开发工作.去哪儿网运维开发有一个特点,所有开发既当 PM,又当 QA,也没有区分前端工作还是后端工作,用现在比较流行的话说,我们都是全栈工程师. 我有几张阿 ...

最新文章

  1. 机器学习各领域必读经典综述
  2. 后摩尔定律时代的芯片新选择!
  3. java基础 知识点
  4. redis 导出导入详解
  5. C/C++从源代码到生成可执行程序的过程详解!
  6. 家装灯线走线图_电工装修走线图_电工装饰走线图
  7. JQuery闭包,插件的写法
  8. 《dp补卡——343. 整数拆分、96. 不同的二叉搜索树》
  9. android Instrumentation 转载
  10. MCU HardFault问题查找和破解方法
  11. 线段树,最大值查询位子(个人模版)
  12. filegee为啥没变动也更新_小米miui12中谷歌商店无法更新油管和下载Twitter的问题...
  13. win7备份工具_u盘系统重装win7旗舰版详细图解教程
  14. xpath 取标签下所有文字内容_如何理解葡萄酒标签上的所有内容(下)
  15. Zookeeper(一) zookeeper基础使用
  16. FAT32 文件系统详解
  17. 基于C#实现与新大陆扫码枪通信
  18. Beaglebone Black – 智能家居控制系统 LAS - 插座组装
  19. asp.net nancy_如何在ASP.Net Core中使用Nancy
  20. [记录]Cloudflare之WARP及其他app的DNS测试

热门文章

  1. 禁止遮罩层以下屏幕滑动----正解(更新版)
  2. Poj 3246 Balanced Lineup(线段树基础)
  3. [笔记] systemverilog学习笔录
  4. 转载:由图片SEO想起
  5. 很酷的一套 Flex/AIR 皮肤 (KingnareStyle)
  6. traceroute程序_来!程序猿教你们玩微信代码~
  7. 查linux有哪些task_Java面试手册:Linux高频考点
  8. 外网ip怎么查_无公网IP的情况下,搞定群晖并实现远程Nas访问
  9. python直方图均衡化代码_基于matlab的直方图均衡化代码
  10. mysql教程 api_Mysql入门系列:MySQL可用的API