最后更新2021/08/07

本节只介绍基础HMC相关的概念、连接、操作方式和功能实现原理,具体每项动作、功能内容见后续介绍。

IBM的设计一如既往地可用性优先,IBM POWER小型机无论高低端都支持双HMC管理,每台小型机至少有一块Firmware Service Processor(FSP)微码服务控制卡,FSP卡都有两个网络端口,可以分别接驳一台HMC。如果是中高端小型机,更安装有两个FSP卡,即使一个管理控制卡出问题,HMC还是可以通过另一个管理控制卡进行管理。

HMC的本质功能是提供管理工作的人机接口一边接受管理员发布的命令,先进行基本校验,确保命令合理、合法,再发送给FSP卡执行底层动作;底层操作完成后,HMC还要与上层各个分区上运行的操作系统通信,通知其底层已经给变,由操作系统执行动态配置命令“接受、识别”底层的变化。因此HMC,既要能够与小型机的FSP卡通信,同时也要与小型机的分区通信。由于FSP卡至关重要,并且在整个过程中只需要与HMC通信,所以HMC与FSP卡之间的连接通常设置在非公开的网段里,而HMC与分区通信则通过普通的开放网段。

为什么不让FSP直接把底层变化直接推送给操作系统呢?这样就可以省略了HMC与各分区之间的连接,岂不是更简单可靠?这是在分析了实现的复杂性和安全等问题之后综合考虑的结果。无论是FSP还是HMC告知分区操作系统底层发生改变,总是需要有机制实现设备变化识别这一功能。即使Windows所谓的“即插即用”也不过是在操作系统有一个后台进程不断进行硬件扫描(与硬件微码通信),发现设备变化之后进行相应的操作系统配置。在用户终端设备,为了减少用户操作,可以以牺牲性能的方式“轮询”设备变化,而在高端企业级设备,这种“奢侈”的性能牺牲显然无法接受,更何况如果“轮询”中间出现严重问题,有造成机器死机(内核崩溃)的可能,所以一般可靠性要求高的系统都采用中断、通知的方案。再者,如果由FSP直接去通知操作系统,必然需要把FSP与操作系统之间的通信协议固化到FSP的程序中,由于FSP属于“硬件微码”,其升级、维护比HMC更为复杂,需要更加稳定的版本控制。因此,实现同样的“告知”功能,如果要增加新功能、变化通信协议,还是HMC更为灵活方便。况且HMC的运行硬件是PC Server,比FSP单板机的性能要好得多,程序容量也不是问题。

因此综合考虑,IBM采用了由HMC去“通知”分区操作系统的方案,尽管这个方案在实际实施中,遇到了很多HMC与分区之间“通信不畅”的问题,需要人工干预解决。HMC、FSP、分区操作系统之间的通信请求大致是这样的一个过程:

  1. FSP如果使用HMC DHCP功能获得IP地址,则HMC和FSP自动通过DHCP的交互信息,找到对方地址,进行通信。如果FSP采用固定IP地址,则需要手工在HMC输入FSP的IP,由HMC主动连接FSP,此既2.5.1 HMC扫描小型机过程。
  2. 当分区启动的时候,操作系统会去读取(虚拟化之后的)硬件配置信息,这些信息由FSP提供,其中就包括了当前HMC的IP地址。分区操作系统利用读取到的地址主动连接HMC,建立连接。这样HMC、FSP、分区之间的管理链就建立起来了。由于读取动作只在启动初始化的时候执行,因此如果分区运行过程中如果更换了HMC的地址,分区操作系统很可能就会失去与HMC的连接。之所以不是100%丢失连接,这是由于在更改HMC地址之前,如果HMC和分区已经建立好了连接,HMC可以通知各个分区自己的新地址,但这个过程不一定可靠。如果发生分区与HMC通信问题,比较简单的解决方案是重启分区的操作系统。

基于HMC同时与FSP和分区的通信需求,HMC需要提供两个网络接口,一个接入FSP管理网段,另一个连入普通的分区网段。当然,在一些不要求安全的环境下,HMC只需要一个网络接口,通过此接口同时与FSP和分区通信。在本书中,我们仅讨论标准的连接方式。根据FSP卡的数量不同[ 每台IBM小型机至少有一个FSP,最多有两个。根据小型机机型不同,其标配的FSP数量也不同。低端小型机(p520)标配一个SFP,最多也只能有一个FSP;中端小型机(例如p570)每个Drawer标配一个,如果有两个以上的Drawer就是标配两个;高端小型机(p595)标配即两个。

至此,会有4种组合关系,分别是单HMC单FSP;单HMC双FSP;双HMC单FSP;双HMC双FSP。如果连接不正确或者微码版本不匹配(要求两个FSP微码版本一致并与HMC微码在互相支持的范围之内),尽管有时也可以管理小型机,但是经常会出现一些莫名其妙的错误,包括HMC上的错误提示、HMC连接经常自己中断、执行命令失败等,因此建议一定要用标准的连接方式,一定要升级到匹配的微码版本。

单HMC及单/双FSP连接方式很简单,只要把HMC内部网接口与FSP卡的HMC1(每个FSP有两个网络接口,分别是HMC1和HMC2)接口连到同一HUB/VLan,HMC外部网络接口则接到小型机分区可以访问到网络里,如<图 3333 单HMC+单FSP 网络连接图 33 单HMC+单FSP 网络连接>所示。在连接FSP网络的时候,一定不能把同一FSP卡的两个端口连接到同一IP子网,即使物理上这两个端口连接到同一个VLAN,也需要通过人工设置,分别指定到不同的IP子网。也就是说每个FSP卡可以只使用一个端口,但如果使用两个端口,必须两个端口的IP不在同一网段,这是FSP卡软件微码设计的要求,避免出现路由混乱。
HMC上的网络接口一般有3个[ 新型号的HMC有4个可用的网络接口,而且看起来是5个,最左边的一个是AMM,不同于其它4个,是HMC自身硬件(PC Server)的管理接口。],本身没有区别,可以通过管理界面设置,任意选择,一般最左侧的一个用于内部管理网,控制小型机FSP卡;中间的用于普通生产网(如果没有此网络连接,无法执行DLpar操作);最右侧的为Internet保留,用于HMC回叫/Internet服务支持功能。内部管理网建议不仅仅是IP网段隔离,而且采用完全独立的VLan或者Hub,FSP也不需要从外界登录,如果必须登录FSP进行管理,可以经由HMC作为双宿主机跳转,先登录到HMC,再进入FSP。
图 13 单HMC+单FSP 网络连接

有两点原因需要将HMC内部管理网和普通生产网的VLan隔离:

  1. 内部管理网非常重要,FSP内部微码尽管有一定的安全保障,但由并没有针对网络攻击进行专门设计,毕竟这是防火墙的专职工作!而且FSP卡类似单板机,可运行的程序非常短小,不能部署大型软件,但FSP的权利又极其强大,甚至可以把运行中的小型机下电或删除分区!因此建议将此网段完全隔离出来,没有路由可进入此网段,而必须经由HMC跳转。HMC比FSP抵抗能力更强,部署有专门的防火墙软件,相对更能抵抗外界攻击;
  2. FSP一般采用DHCP获取IP地址,HMC自身就是DHCP小型机,因此最好与网络中其他DHCP客户端、小型机隔离开来,以免造成IP管理混乱或者相互影响。这也是当采用双HMC的时候,需要用两个VLan/Hub连接FSP的原因,FSP的HMC1口连接一个VLan,HMC2口连接另一个VLan,具体如<图 3444 双HMC+双FSP网络连接图 34 双HMC+双FSP网络连接>所示。
    图 14 双HMC+双FSP网络连接

HMC的物理端口没有区别,可以任意定义其功能——连接内部管理网或者普通生产网络。其实HMC上并没有直接区分,而是通过几个物理网络端口参数来控制,这几个参数分别是:Private/Open,Partition Communication,如<图 3555 HMC网络接口设置图 15 HMC网络接口设置>所示。
图 15 HMC网络接口设置

Private或者Open选项用于控制私有还是开放网络。如果是私有网络,则可以选择启动DHCP服务,HMC响应此物理端口接收到的DHCP请求。IBM限定了私有网络DHCP服务的IP地址段,不能任意设定,只能从预设中选择(大约20个预设网段)。私有网络的设计用途是为了HMC和小型机FSP通信。在选择网段的时候,一定要使用企业自身没有使用的网段,以避免路由混乱。即使HMC内部网完全独立也是如此,因为HMC本身就是双宿主机,它还有连通普通生产网的接口,如果网段冲突,从某些特定的网络访问HMC就会出问题。如果预设网段不能满足要求,或者希望更精细地管理,则可以禁止HMC DHCP功能,手工设置每个FSP HMC接口和HMC内部网接口的IP,当然他们必须在同一网段内。尽管HMC访问FSP可以跨路由,也就是可以在不同网段,但真的没有任何理由必须将它们放到不同网段,如果HMC和FSP距离很远,建议在本地放置一台HMC,而不要跨网段管理。节省一台PC Server的成本(HMC的硬件就是PC Server)与因此而导致的麻烦相比,不值一提。

如果是开放网络,则用于管理员连接HMC以及HMC同各分区通信。较早的HMC版本需要选择“Partition Communication”选项,缺省是禁止的。新版的HMC则允许使用所有的网络接口去和各个分区通信,不再有此选项,只有Partition Communication Enabled标记提示。如果某个分区与HMC能够正常连通,即可实现DLpar功能。否则就无法实现DLpar功能(也无法实现LPM,因为DLpar是LPM的基础)。

尽管推荐使用内部私有网络链接小型机的FSP,并不是说此配置是唯一选择。其实我们也可以使用开放“Open”网络连接小型机FSP,那么只需要一个端口就可以同时实现FSP和分区管理,而且HMC与FSP的所有通信都是经过SSL加密的,无论走那个网络都可以保证基本的安全性。不过这并不是推荐的做法,只是可行的方案,可以用于测试等非重要生产环境。

如果使用开放网络连接FSP,由于HMC不能为此网络打开DHCP服务,所以必须将FSP配置为使用固定IP,可以通过ASMI登录进FSP后更改。当然,首次登陆还是需要临时将FSP与HMC私有网络端口对接,以便临时获得IP地址供登录。如果FSP没有找到DHCP小型机为其提供IP,经过一段时间超时后,FSP自动使用缺省地址,FSP上HMC1端口的缺省地址是192.168.2.147、HMC2是192.168.3.147。通过小型机液晶控制板也可以看到当前FSP的IP地址,更多关于ASMI操作信息请参考<6.26.1 ASMI管理ASMI管理>一节。
如前所述,不仅HMC连接方式,小型机FSP微码、HMC版本之间也必须匹配才能保证HMC可以正常管理小型机,匹配关系请参考Power Code Matrix。后续的屏幕截图是作者写作当时的网站屏幕截图,相信其中的版本关系已经过时,请读者自己访问下面地址获得最新信息:
https://www14.software.ibm.com/webapp/set2/flrt/mtm

图65 Power Code Matrix for All
图 36 Power Code Matrix for E980
如<图 36 Power Code Matrix for E980>所示,经由浏览器访问matix网址进入Power Code Matrix页面之后,先选择一种CPU类型,例如Power 9,然后选择对应机型,最后点view

从<图 36 Power Code Matrix for E980>中可以了解到小型机微码和HMC之间的匹配、建议关系,但图中有很多专用术语,还需要在此介绍一下:
微码版本。从HMC上查看小型机微码版本格式是:VHXXX_YYY_ZZZ。
其中VH是打包及机器类型识别码。VH代表高端Power 9小型机,VL是Power 低端,VM是中端。XXX表示Release,既发行版,在图 36中可以看到当前的发行版是VH950,940等;YYY是维护/服务版,即微码发行版的补丁(到处都是补丁!),而最后3位ZZZ不一定存在,如果有则表示从哪一版补丁(ZZZ表示)可以不间断地升级到YYY补丁。微码发行版(Release)升级都是disruptive(间断的,既需要将整台小型机下电,再重新上电,当然其承载的所有分区都需要关闭);而如果仅仅是补丁升级,则有可能采用Concurrent(并行方式),既无需停机,可以在线升级。可并行升级的版本必须高于zzz。
例如,当前小型机微码版本是SF235_180_160,可以不间断升级到SF235_185_160,但是如果要升级到SF235_190_185则必须间断。另外要注意,即使不间断升级,一般也只能进行一次,也就是说升级之后必须找到合适的时间重启整台小型机,确认升级,否则再次升级的时候,系统会提示当前有deffered或者pending的版本,无法继续升级。

  • Latest Release Level最新发行版,表示刚发布3个月以内的微码;
    Maximum Stability Release Level最稳定发行版,这是已经发布一段时间,用户反映良好的版本,对于稳定性要求第一,而不考虑微码新特性(例如最近没有添加/升级硬件要求)的用户,建议使用此版本;
  • Reduced Fix Support 部分支持版,表示此版本微码已经到了生命周期的最后3个月,IBM马上就不会再对其提供普通技术支持,但是依然对某些非常严重的故障提供支持,例如可能导致系统宕机的数据完整性问题。但是IBM将不再支持其它影响很小或者只有在极其特殊配置才会出现的故障,例如使用X.25卡出现问题等等。由于此版本微码马上就要完全失去技术支持,建议用户尽快(2-3个月内)升级到IBM依然提供支持的版本,当然最好是当前的Maximum Stability Release Level版本。
  • End of Service Pack 不提供支持版。此版本微码已经过了IBM技术支持周期,IBM虽然依然可以帮助分析故障(前提是机器依然由IBM保修),但是不会再为发现的故障提供补丁,建议尽快升级的支持版。目前微码从最新发布到不再提供支持的时间是:Power 6两年,Power 5一年。
  • Upgrade strategy微码升级策略。微码增加了新功能、对新机型提供支持都会导致新微码发行版本(Release)发布,而如果单存是修复bug则是补丁版(Service Pack)。IBM建议新微码发布之后等待2-3个月再升级微码。升级微码既可以升级发行版,也可以只升级补丁(保持发行版不变),通常后者有可能不需要间断升级,升级过程可以在线完成,而且升级时间更短,升级失败的风险也更低一些。
  • Concurrent fix 在线/并行升级,表示升级微码过程可以不经由停机完成,仅仅是FSP可能需要重新启动,升级过程中各AIX分区不受影响。
  • Deferred fix 微码安装过程是并行的,但是需要等待一次停机(小型机整机重新上电)以便激活使用所有功能。通常在停机之前,不能再次执行升级操作。
  • Disruptive fix间断升级,必须重新下电、上电小型机,所有分区都会受影响。
  • Not a Supported Combination不支持的组合。由于HMC通过小型机FSP管理小型机,而在HMC和FSP上都有对应的软件、微码运行,这其中就存在着组合关系,如果HMC软件或小型机微码的版本太低,不能支持对方,则被称为不支持的组合。

另外IBM提供了FLRT(Firmware Level Recommendation Tools微码版本建议工具),这是一个网站工具,点击Code Matrix页面的FLRT链接可以进入。根据工具页面提示,依次输入信息,最后系统会给出IBM建议的微码版本和组合。图 3 Power 9高端小型机Code Matrix>所示页面中的FLRT连接可以进入微码建议组合工具页面。
图 68 FLRT工具

根据FLRT工具提示,依次输入当前系统信息,则最后FLRT将会返回IBM建议的各种硬件微码、软件补丁组合。如<图 3888 FLRT工具图 37 FLRT工具>及<图 3999 FLRT结果图 38 FLRT结果>所示。示例中是9119-FHA即Power 6 595小型机,CPU主频4.2GHz,微码版本EH350_049,AIX操作系统为AIX 6.1 TL04 SP00,安装了Power HA 5.5,使用HMC V7R350 SP1,希望安装VIO 1.5.2.1。此配置经由FLRT审核,发现硬件微码、软件补丁都符合要求,但VIO版本太低,需要安装较高的版本。
在另一个FLRT校验中(图 3101010 FLRT建议图 39 FLRT建议),系统提示VIO版本虽然支持,但需要打到1.5.2.11-FP11。
图 19 FLRT结果
图 110 FLRT建议
一台HMC可以管理许多小型机,在国内通常的环境下,不会遇到管理上限(随HMC版本不同,具体请参考各个HMC版本的发布说明。例如HMC Version 7.7.1最多支持48台普通小型机或者32台最高端590/595小型机,最多支持1024个分区。不过基于性能和可靠性考虑,十几台低端小型机或者几台高端小型机组成一组,共用一组(两台)HMC是比较合适的方案。
几乎所有的虚拟化功能都由HMC管理、实现或者至少需要HMC参与,即使IBM新发布的各种云计算管理方案、工具,落实到最终设备管理层,都需要HMC作为管理命令的实际发布者。我们将在后续章节依次介绍HMC/PowerVM的各种功能的实现。

3.1 HMC管理功能相关推荐

  1. 使用HMC管理powerlinux

    使用hmc管理powerlinux IBM PowerLinux7 小型机一般不带显卡,没有视频插口,只有HMC网线插口.只能通过专用服务hmc进行管理,或者可以通过网站链接HMC口1或者HMC2口与 ...

  2. XenMobile 8.7对iOS7.1 企业级MDM管理功能带来哪些扩展?

    在最新发布的iOS版本中,苹果继续推进企业迄需的管理功能.iOS7引入了一套令CIO砰然心动的企业级管理功能.让我们快速浏览一下. 善用这些功能,能创建一些有吸引力的企业用例.CIO们,设想一下: 1 ...

  3. idea 报系统分区磁盘不足_系统磁盘管理功能讲解,电脑硬盘分区格式化修改驱动器号图文教程...

    大家好,我是老盖,感谢观看本篇文章,本文做的也有视频,也可以看我发布的视频. 今天给大家讲一下系统自带的磁盘管理管理功能,磁盘管理比较常用的是硬盘分区,格式化和更改驱动器号这几个功能. 对着计算机点右 ...

  4. Chrome现在也能编辑pdf文件了!64位安卓版上线,网页加载快10%,还有良心标签管理功能...

    贾浩楠 发自 凹非寺 量子位 报道 | 公众号 QbitAI 全世界最多人在用的Chrome浏览器,今天更新了. 版本号:Chrome 85. 增加一系列标签管理功能,还自带PDF编辑器,并且提升10 ...

  5. 5G NGC — SMF 会话管理功能

    目录 文章目录 目录 SMF SMF 过载控制 NF Services Nsmf_PDUSession Service Create SM Context service operation Upda ...

  6. 5G NGC — AMF 接入和移动性管理功能

    目录 文章目录 目录 AMF 对 UE 进行移动性管理的主要流程 NF Services AMF AMF(Access and Mobility Management Function,接入和移动性管 ...

  7. 用 Flask 来写个轻博客 (30) — 使用 Flask-Admin 增强文章管理功能

    Blog 项目源码:https://github.com/JmilkFan/JmilkFan-s-Blog 目录 目录 前文列表 扩展阅读 实现文章管理功能 实现效果 前文列表 用 Flask 来写个 ...

  8. rpm包管理功能全解

    rpm包管理功能全解 rpm包管理功能全解              linux rpm问题:怎样查看rpm安装包的安装路径                      rpm -qa l grep   ...

  9. 基于bootstrap实现简单用户管理功能

    基于bootstrap实现简单用户管理功能,包括增删改以及列表分页展示功能. 1.web.xml配置servlet映射: <servlet><servlet-name>User ...

最新文章

  1. activiti实战系列 并行网关(parallelGateWay)
  2. 【问题记录】pytorch自定义数据集 No such file or directory, invalid index of a 0-dim
  3. azure云数据库_在Azure SQL数据库中保护数据的五种方法
  4. 编写高效的C++程序方法之使用对象池
  5. layui table 字体大小_根据状态修改layui表格显示的文字及字体颜色
  6. libyuv库简单使用
  7. GitHub桌面版 Github Desktop 下载
  8. 佳能Canon imageCLASS MF4712 打印机驱动
  9. [供应链·案例篇]疫情影响下的全球十大零售商都做了些什么
  10. python:实现使用分而治之找到单峰列表的峰值算法(附完整源码)
  11. 接口自动化测试实践指导(上):接口自动化需要做哪些准备工作
  12. 华为HCIE-CloudComputing备考笔记-2021.10
  13. 零跑汽车冲刺港股:年营收31亿 去年曾募资88亿
  14. JavaWeb随手笔记
  15. 基于正则表达式(python)对东方财富网上证指数吧爬虫实例
  16. 橘子学ES03之Docker安装ELK+cerebro
  17. [Android相机]光线传感器识别环境光亮强度
  18. Android电子书翻页效果
  19. linux下格式化apfs,APFS文件系统科普贴
  20. webrtc android web,WebRTC Android版本编译

热门文章

  1. 【贝叶斯滤波与卡尔曼滤波】 第四讲 连续随机变量的贝叶斯公式
  2. HFSS 3D LAOUT PCB 裁剪,差分线,过孔仿真和优化
  3. 《抽样技术》第3章 分层随机抽样(st)
  4. 使用C语言编写测速程序
  5. 使用barrier共享键鼠
  6. Shader——漩涡效果
  7. 安卓 jni 开发错误 UnsatisfiedLinkError: Native method not found
  8. 华为、华三设备日常工作使用配置命令
  9. git bisect 与 git blame
  10. Python 网络爬虫实战:去哪儿网旅游攻略图文爬取保存为 Markdown电子书