3.1 HMC管理功能
最后更新2021/08/07
本节只介绍基础HMC相关的概念、连接、操作方式和功能实现原理,具体每项动作、功能内容见后续介绍。
IBM的设计一如既往地可用性优先,IBM POWER小型机无论高低端都支持双HMC管理,每台小型机至少有一块Firmware Service Processor(FSP)微码服务控制卡,FSP卡都有两个网络端口,可以分别接驳一台HMC。如果是中高端小型机,更安装有两个FSP卡,即使一个管理控制卡出问题,HMC还是可以通过另一个管理控制卡进行管理。
HMC的本质功能是提供管理工作的人机接口一边接受管理员发布的命令,先进行基本校验,确保命令合理、合法,再发送给FSP卡执行底层动作;底层操作完成后,HMC还要与上层各个分区上运行的操作系统通信,通知其底层已经给变,由操作系统执行动态配置命令“接受、识别”底层的变化。因此HMC,既要能够与小型机的FSP卡通信,同时也要与小型机的分区通信。由于FSP卡至关重要,并且在整个过程中只需要与HMC通信,所以HMC与FSP卡之间的连接通常设置在非公开的网段里,而HMC与分区通信则通过普通的开放网段。
为什么不让FSP直接把底层变化直接推送给操作系统呢?这样就可以省略了HMC与各分区之间的连接,岂不是更简单可靠?这是在分析了实现的复杂性和安全等问题之后综合考虑的结果。无论是FSP还是HMC告知分区操作系统底层发生改变,总是需要有机制实现设备变化识别这一功能。即使Windows所谓的“即插即用”也不过是在操作系统有一个后台进程不断进行硬件扫描(与硬件微码通信),发现设备变化之后进行相应的操作系统配置。在用户终端设备,为了减少用户操作,可以以牺牲性能的方式“轮询”设备变化,而在高端企业级设备,这种“奢侈”的性能牺牲显然无法接受,更何况如果“轮询”中间出现严重问题,有造成机器死机(内核崩溃)的可能,所以一般可靠性要求高的系统都采用中断、通知的方案。再者,如果由FSP直接去通知操作系统,必然需要把FSP与操作系统之间的通信协议固化到FSP的程序中,由于FSP属于“硬件微码”,其升级、维护比HMC更为复杂,需要更加稳定的版本控制。因此,实现同样的“告知”功能,如果要增加新功能、变化通信协议,还是HMC更为灵活方便。况且HMC的运行硬件是PC Server,比FSP单板机的性能要好得多,程序容量也不是问题。
因此综合考虑,IBM采用了由HMC去“通知”分区操作系统的方案,尽管这个方案在实际实施中,遇到了很多HMC与分区之间“通信不畅”的问题,需要人工干预解决。HMC、FSP、分区操作系统之间的通信请求大致是这样的一个过程:
- FSP如果使用HMC DHCP功能获得IP地址,则HMC和FSP自动通过DHCP的交互信息,找到对方地址,进行通信。如果FSP采用固定IP地址,则需要手工在HMC输入FSP的IP,由HMC主动连接FSP,此既2.5.1 HMC扫描小型机过程。
- 当分区启动的时候,操作系统会去读取(虚拟化之后的)硬件配置信息,这些信息由FSP提供,其中就包括了当前HMC的IP地址。分区操作系统利用读取到的地址主动连接HMC,建立连接。这样HMC、FSP、分区之间的管理链就建立起来了。由于读取动作只在启动初始化的时候执行,因此如果分区运行过程中如果更换了HMC的地址,分区操作系统很可能就会失去与HMC的连接。之所以不是100%丢失连接,这是由于在更改HMC地址之前,如果HMC和分区已经建立好了连接,HMC可以通知各个分区自己的新地址,但这个过程不一定可靠。如果发生分区与HMC通信问题,比较简单的解决方案是重启分区的操作系统。
基于HMC同时与FSP和分区的通信需求,HMC需要提供两个网络接口,一个接入FSP管理网段,另一个连入普通的分区网段。当然,在一些不要求安全的环境下,HMC只需要一个网络接口,通过此接口同时与FSP和分区通信。在本书中,我们仅讨论标准的连接方式。根据FSP卡的数量不同[ 每台IBM小型机至少有一个FSP,最多有两个。根据小型机机型不同,其标配的FSP数量也不同。低端小型机(p520)标配一个SFP,最多也只能有一个FSP;中端小型机(例如p570)每个Drawer标配一个,如果有两个以上的Drawer就是标配两个;高端小型机(p595)标配即两个。
至此,会有4种组合关系,分别是单HMC单FSP;单HMC双FSP;双HMC单FSP;双HMC双FSP。如果连接不正确或者微码版本不匹配(要求两个FSP微码版本一致并与HMC微码在互相支持的范围之内),尽管有时也可以管理小型机,但是经常会出现一些莫名其妙的错误,包括HMC上的错误提示、HMC连接经常自己中断、执行命令失败等,因此建议一定要用标准的连接方式,一定要升级到匹配的微码版本。
单HMC及单/双FSP连接方式很简单,只要把HMC内部网接口与FSP卡的HMC1(每个FSP有两个网络接口,分别是HMC1和HMC2)接口连到同一HUB/VLan,HMC外部网络接口则接到小型机分区可以访问到网络里,如<图 3333 单HMC+单FSP 网络连接图 33 单HMC+单FSP 网络连接>所示。在连接FSP网络的时候,一定不能把同一FSP卡的两个端口连接到同一IP子网,即使物理上这两个端口连接到同一个VLAN,也需要通过人工设置,分别指定到不同的IP子网。也就是说每个FSP卡可以只使用一个端口,但如果使用两个端口,必须两个端口的IP不在同一网段,这是FSP卡软件微码设计的要求,避免出现路由混乱。
HMC上的网络接口一般有3个[ 新型号的HMC有4个可用的网络接口,而且看起来是5个,最左边的一个是AMM,不同于其它4个,是HMC自身硬件(PC Server)的管理接口。],本身没有区别,可以通过管理界面设置,任意选择,一般最左侧的一个用于内部管理网,控制小型机FSP卡;中间的用于普通生产网(如果没有此网络连接,无法执行DLpar操作);最右侧的为Internet保留,用于HMC回叫/Internet服务支持功能。内部管理网建议不仅仅是IP网段隔离,而且采用完全独立的VLan或者Hub,FSP也不需要从外界登录,如果必须登录FSP进行管理,可以经由HMC作为双宿主机跳转,先登录到HMC,再进入FSP。
图 13 单HMC+单FSP 网络连接
有两点原因需要将HMC内部管理网和普通生产网的VLan隔离:
- 内部管理网非常重要,FSP内部微码尽管有一定的安全保障,但由并没有针对网络攻击进行专门设计,毕竟这是防火墙的专职工作!而且FSP卡类似单板机,可运行的程序非常短小,不能部署大型软件,但FSP的权利又极其强大,甚至可以把运行中的小型机下电或删除分区!因此建议将此网段完全隔离出来,没有路由可进入此网段,而必须经由HMC跳转。HMC比FSP抵抗能力更强,部署有专门的防火墙软件,相对更能抵抗外界攻击;
- FSP一般采用DHCP获取IP地址,HMC自身就是DHCP小型机,因此最好与网络中其他DHCP客户端、小型机隔离开来,以免造成IP管理混乱或者相互影响。这也是当采用双HMC的时候,需要用两个VLan/Hub连接FSP的原因,FSP的HMC1口连接一个VLan,HMC2口连接另一个VLan,具体如<图 3444 双HMC+双FSP网络连接图 34 双HMC+双FSP网络连接>所示。
图 14 双HMC+双FSP网络连接
HMC的物理端口没有区别,可以任意定义其功能——连接内部管理网或者普通生产网络。其实HMC上并没有直接区分,而是通过几个物理网络端口参数来控制,这几个参数分别是:Private/Open,Partition Communication,如<图 3555 HMC网络接口设置图 15 HMC网络接口设置>所示。
图 15 HMC网络接口设置
Private或者Open选项用于控制私有还是开放网络。如果是私有网络,则可以选择启动DHCP服务,HMC响应此物理端口接收到的DHCP请求。IBM限定了私有网络DHCP服务的IP地址段,不能任意设定,只能从预设中选择(大约20个预设网段)。私有网络的设计用途是为了HMC和小型机FSP通信。在选择网段的时候,一定要使用企业自身没有使用的网段,以避免路由混乱。即使HMC内部网完全独立也是如此,因为HMC本身就是双宿主机,它还有连通普通生产网的接口,如果网段冲突,从某些特定的网络访问HMC就会出问题。如果预设网段不能满足要求,或者希望更精细地管理,则可以禁止HMC DHCP功能,手工设置每个FSP HMC接口和HMC内部网接口的IP,当然他们必须在同一网段内。尽管HMC访问FSP可以跨路由,也就是可以在不同网段,但真的没有任何理由必须将它们放到不同网段,如果HMC和FSP距离很远,建议在本地放置一台HMC,而不要跨网段管理。节省一台PC Server的成本(HMC的硬件就是PC Server)与因此而导致的麻烦相比,不值一提。
如果是开放网络,则用于管理员连接HMC以及HMC同各分区通信。较早的HMC版本需要选择“Partition Communication”选项,缺省是禁止的。新版的HMC则允许使用所有的网络接口去和各个分区通信,不再有此选项,只有Partition Communication Enabled标记提示。如果某个分区与HMC能够正常连通,即可实现DLpar功能。否则就无法实现DLpar功能(也无法实现LPM,因为DLpar是LPM的基础)。
尽管推荐使用内部私有网络链接小型机的FSP,并不是说此配置是唯一选择。其实我们也可以使用开放“Open”网络连接小型机FSP,那么只需要一个端口就可以同时实现FSP和分区管理,而且HMC与FSP的所有通信都是经过SSL加密的,无论走那个网络都可以保证基本的安全性。不过这并不是推荐的做法,只是可行的方案,可以用于测试等非重要生产环境。
如果使用开放网络连接FSP,由于HMC不能为此网络打开DHCP服务,所以必须将FSP配置为使用固定IP,可以通过ASMI登录进FSP后更改。当然,首次登陆还是需要临时将FSP与HMC私有网络端口对接,以便临时获得IP地址供登录。如果FSP没有找到DHCP小型机为其提供IP,经过一段时间超时后,FSP自动使用缺省地址,FSP上HMC1端口的缺省地址是192.168.2.147、HMC2是192.168.3.147。通过小型机液晶控制板也可以看到当前FSP的IP地址,更多关于ASMI操作信息请参考<6.26.1 ASMI管理ASMI管理>一节。
如前所述,不仅HMC连接方式,小型机FSP微码、HMC版本之间也必须匹配才能保证HMC可以正常管理小型机,匹配关系请参考Power Code Matrix。后续的屏幕截图是作者写作当时的网站屏幕截图,相信其中的版本关系已经过时,请读者自己访问下面地址获得最新信息:
https://www14.software.ibm.com/webapp/set2/flrt/mtm
图65 Power Code Matrix for All
图 36 Power Code Matrix for E980
如<图 36 Power Code Matrix for E980>所示,经由浏览器访问matix网址进入Power Code Matrix页面之后,先选择一种CPU类型,例如Power 9,然后选择对应机型,最后点view
从<图 36 Power Code Matrix for E980>中可以了解到小型机微码和HMC之间的匹配、建议关系,但图中有很多专用术语,还需要在此介绍一下:
微码版本。从HMC上查看小型机微码版本格式是:VHXXX_YYY_ZZZ。
其中VH是打包及机器类型识别码。VH代表高端Power 9小型机,VL是Power 低端,VM是中端。XXX表示Release,既发行版,在图 36中可以看到当前的发行版是VH950,940等;YYY是维护/服务版,即微码发行版的补丁(到处都是补丁!),而最后3位ZZZ不一定存在,如果有则表示从哪一版补丁(ZZZ表示)可以不间断地升级到YYY补丁。微码发行版(Release)升级都是disruptive(间断的,既需要将整台小型机下电,再重新上电,当然其承载的所有分区都需要关闭);而如果仅仅是补丁升级,则有可能采用Concurrent(并行方式),既无需停机,可以在线升级。可并行升级的版本必须高于zzz。
例如,当前小型机微码版本是SF235_180_160,可以不间断升级到SF235_185_160,但是如果要升级到SF235_190_185则必须间断。另外要注意,即使不间断升级,一般也只能进行一次,也就是说升级之后必须找到合适的时间重启整台小型机,确认升级,否则再次升级的时候,系统会提示当前有deffered或者pending的版本,无法继续升级。
- Latest Release Level最新发行版,表示刚发布3个月以内的微码;
Maximum Stability Release Level最稳定发行版,这是已经发布一段时间,用户反映良好的版本,对于稳定性要求第一,而不考虑微码新特性(例如最近没有添加/升级硬件要求)的用户,建议使用此版本; - Reduced Fix Support 部分支持版,表示此版本微码已经到了生命周期的最后3个月,IBM马上就不会再对其提供普通技术支持,但是依然对某些非常严重的故障提供支持,例如可能导致系统宕机的数据完整性问题。但是IBM将不再支持其它影响很小或者只有在极其特殊配置才会出现的故障,例如使用X.25卡出现问题等等。由于此版本微码马上就要完全失去技术支持,建议用户尽快(2-3个月内)升级到IBM依然提供支持的版本,当然最好是当前的Maximum Stability Release Level版本。
- End of Service Pack 不提供支持版。此版本微码已经过了IBM技术支持周期,IBM虽然依然可以帮助分析故障(前提是机器依然由IBM保修),但是不会再为发现的故障提供补丁,建议尽快升级的支持版。目前微码从最新发布到不再提供支持的时间是:Power 6两年,Power 5一年。
- Upgrade strategy微码升级策略。微码增加了新功能、对新机型提供支持都会导致新微码发行版本(Release)发布,而如果单存是修复bug则是补丁版(Service Pack)。IBM建议新微码发布之后等待2-3个月再升级微码。升级微码既可以升级发行版,也可以只升级补丁(保持发行版不变),通常后者有可能不需要间断升级,升级过程可以在线完成,而且升级时间更短,升级失败的风险也更低一些。
- Concurrent fix 在线/并行升级,表示升级微码过程可以不经由停机完成,仅仅是FSP可能需要重新启动,升级过程中各AIX分区不受影响。
- Deferred fix 微码安装过程是并行的,但是需要等待一次停机(小型机整机重新上电)以便激活使用所有功能。通常在停机之前,不能再次执行升级操作。
- Disruptive fix间断升级,必须重新下电、上电小型机,所有分区都会受影响。
- Not a Supported Combination不支持的组合。由于HMC通过小型机FSP管理小型机,而在HMC和FSP上都有对应的软件、微码运行,这其中就存在着组合关系,如果HMC软件或小型机微码的版本太低,不能支持对方,则被称为不支持的组合。
另外IBM提供了FLRT(Firmware Level Recommendation Tools微码版本建议工具),这是一个网站工具,点击Code Matrix页面的FLRT链接可以进入。根据工具页面提示,依次输入信息,最后系统会给出IBM建议的微码版本和组合。图 3 Power 9高端小型机Code Matrix>所示页面中的FLRT连接可以进入微码建议组合工具页面。
图 68 FLRT工具
根据FLRT工具提示,依次输入当前系统信息,则最后FLRT将会返回IBM建议的各种硬件微码、软件补丁组合。如<图 3888 FLRT工具图 37 FLRT工具>及<图 3999 FLRT结果图 38 FLRT结果>所示。示例中是9119-FHA即Power 6 595小型机,CPU主频4.2GHz,微码版本EH350_049,AIX操作系统为AIX 6.1 TL04 SP00,安装了Power HA 5.5,使用HMC V7R350 SP1,希望安装VIO 1.5.2.1。此配置经由FLRT审核,发现硬件微码、软件补丁都符合要求,但VIO版本太低,需要安装较高的版本。
在另一个FLRT校验中(图 3101010 FLRT建议图 39 FLRT建议),系统提示VIO版本虽然支持,但需要打到1.5.2.11-FP11。
图 19 FLRT结果
图 110 FLRT建议
一台HMC可以管理许多小型机,在国内通常的环境下,不会遇到管理上限(随HMC版本不同,具体请参考各个HMC版本的发布说明。例如HMC Version 7.7.1最多支持48台普通小型机或者32台最高端590/595小型机,最多支持1024个分区。不过基于性能和可靠性考虑,十几台低端小型机或者几台高端小型机组成一组,共用一组(两台)HMC是比较合适的方案。
几乎所有的虚拟化功能都由HMC管理、实现或者至少需要HMC参与,即使IBM新发布的各种云计算管理方案、工具,落实到最终设备管理层,都需要HMC作为管理命令的实际发布者。我们将在后续章节依次介绍HMC/PowerVM的各种功能的实现。
3.1 HMC管理功能相关推荐
- 使用HMC管理powerlinux
使用hmc管理powerlinux IBM PowerLinux7 小型机一般不带显卡,没有视频插口,只有HMC网线插口.只能通过专用服务hmc进行管理,或者可以通过网站链接HMC口1或者HMC2口与 ...
- XenMobile 8.7对iOS7.1 企业级MDM管理功能带来哪些扩展?
在最新发布的iOS版本中,苹果继续推进企业迄需的管理功能.iOS7引入了一套令CIO砰然心动的企业级管理功能.让我们快速浏览一下. 善用这些功能,能创建一些有吸引力的企业用例.CIO们,设想一下: 1 ...
- idea 报系统分区磁盘不足_系统磁盘管理功能讲解,电脑硬盘分区格式化修改驱动器号图文教程...
大家好,我是老盖,感谢观看本篇文章,本文做的也有视频,也可以看我发布的视频. 今天给大家讲一下系统自带的磁盘管理管理功能,磁盘管理比较常用的是硬盘分区,格式化和更改驱动器号这几个功能. 对着计算机点右 ...
- Chrome现在也能编辑pdf文件了!64位安卓版上线,网页加载快10%,还有良心标签管理功能...
贾浩楠 发自 凹非寺 量子位 报道 | 公众号 QbitAI 全世界最多人在用的Chrome浏览器,今天更新了. 版本号:Chrome 85. 增加一系列标签管理功能,还自带PDF编辑器,并且提升10 ...
- 5G NGC — SMF 会话管理功能
目录 文章目录 目录 SMF SMF 过载控制 NF Services Nsmf_PDUSession Service Create SM Context service operation Upda ...
- 5G NGC — AMF 接入和移动性管理功能
目录 文章目录 目录 AMF 对 UE 进行移动性管理的主要流程 NF Services AMF AMF(Access and Mobility Management Function,接入和移动性管 ...
- 用 Flask 来写个轻博客 (30) — 使用 Flask-Admin 增强文章管理功能
Blog 项目源码:https://github.com/JmilkFan/JmilkFan-s-Blog 目录 目录 前文列表 扩展阅读 实现文章管理功能 实现效果 前文列表 用 Flask 来写个 ...
- rpm包管理功能全解
rpm包管理功能全解 rpm包管理功能全解 linux rpm问题:怎样查看rpm安装包的安装路径 rpm -qa l grep ...
- 基于bootstrap实现简单用户管理功能
基于bootstrap实现简单用户管理功能,包括增删改以及列表分页展示功能. 1.web.xml配置servlet映射: <servlet><servlet-name>User ...
最新文章
- activiti实战系列 并行网关(parallelGateWay)
- 【问题记录】pytorch自定义数据集 No such file or directory, invalid index of a 0-dim
- azure云数据库_在Azure SQL数据库中保护数据的五种方法
- 编写高效的C++程序方法之使用对象池
- layui table 字体大小_根据状态修改layui表格显示的文字及字体颜色
- libyuv库简单使用
- GitHub桌面版 Github Desktop 下载
- 佳能Canon imageCLASS MF4712 打印机驱动
- [供应链·案例篇]疫情影响下的全球十大零售商都做了些什么
- python:实现使用分而治之找到单峰列表的峰值算法(附完整源码)
- 接口自动化测试实践指导(上):接口自动化需要做哪些准备工作
- 华为HCIE-CloudComputing备考笔记-2021.10
- 零跑汽车冲刺港股:年营收31亿 去年曾募资88亿
- JavaWeb随手笔记
- 基于正则表达式(python)对东方财富网上证指数吧爬虫实例
- 橘子学ES03之Docker安装ELK+cerebro
- [Android相机]光线传感器识别环境光亮强度
- Android电子书翻页效果
- linux下格式化apfs,APFS文件系统科普贴
- webrtc android web,WebRTC Android版本编译