文/俞雄

传统的数据中心通常采用“一机一业务”的部署模式,但是随着数据中心规模不断扩大,这种部署模式会带来管理运营成本过高、业务上线缓慢等问题。通过引入虚拟化技术把数据中心物理设备进行资源池化可以解决上述问题,提高业务部署效率、降低业务迁移的难度。但是同时也带来了如何对虚拟化平台进行监控管理的新问题。

虚拟化平台的监控管理能力对维持虚拟资源池可靠运行尤为重要。虚拟化后单台主机上运行着多台虚拟机,多个业务系统,而现有的虚拟化平台无法对这些业务系统的资源占有情况以及运行状况进行实时监控,对物理主机多个虚拟机之间的拓扑连接情况也是无法直观的显示出来。上述的问题都对虚拟化环境下的监控管理提出了新的要求与挑战。

H3C CAS虚拟化管理平台(下文简称CAS)针对虚拟化平台的上述问题作了改进。在资源池运行状况和业务系统进行了监控,提高了资源池的监控粒度,并输出详细告警和报表。下面会对这些改进做详细分析。

一、资源池运行情况展示与分析

相比传统虚拟化平台关注单个物理主机或虚拟机监控的管理思路,CAS则强调对整个虚拟化系统统一进行监控,全面评估虚拟化系统的健康程度,通过数字或图表的方式展现出来。下面的这些监控指标可以很直观的展示资源池的整体运行情况,从而提高虚拟化平台的可用性。

l资源池健康度分析

CAS通过内置的系统健康度评价模型,从主机、网络、存储等多个维度,对资源池中物理主机和虚拟机的CPU、内存、网络、存储等资源利用率及告警进行综合分析,得到系统健康度评分。当系统健康度得分低于80,就代表系统运行已经存在风险,需要管理员重点关注;当得分低于60,系统则处于高危环境,管理员可通过分析资源池中各物理主机的健康情况进行深入定位,及时找出问题。这种全新的虚拟化健康度管理方法覆盖了虚拟化环境所有层面,能够全面保障虚拟化环境的健康运行。

图1资源池监控概览界面

l集中的性能数据展现

CAS全面收集各类性能数据,在单一界面展示虚拟化系统CPU、内存、存储等各类资源容量及其利用率等指标,通过资源超配比例数值判断瓶颈,为后续资源扩容提供数据支撑。同时利用主机监控概览界面展示资源池中物理主机和虚拟机数目、开关机状态;依据CPU、内存等资源利用率对各个虚拟机的运行状况进行排名,快速发现资源占用最多的主机、虚拟机,为管理员制定合理的资源池规划提供详尽的数据支持。

图2虚拟机监控概览界面

l资源池拓扑展示

CAS还支持虚拟化后资源池的拓扑展示,分别以计算资源、网络资源、存储资源为中心,展示三种视角下的虚拟化拓扑,多层次的展示出物理主机、存储、虚拟交换机、虚拟机之间的内部逻辑关系,增加资源在虚拟化环境下的可视性。同时将各类资源的性能数据及告警非常直观的在拓扑中展示出来,包括物理主机、虚拟机的主机信息、运行状态、资源使用情况、告警等信息,帮助管理员快速了解资源池拓扑及告警情况。

图3资源池拓扑展示

同时,虚拟机由于HA、DRS特性可以在物理主机间灵活迁移,使资源调度更加灵活,但是这样也导致虚拟机迁移的不确定性,使虚拟机的管理更加复杂。原来在某台主机上的虚拟机迁移的目的地是哪里?什么时候发生的迁移?迁移的原因是什么?这些疑问都可以在CAS管理平台界面中查看到。例如虚拟机在物理主机间的位置迁移路径,显示每一次迁移事件的所有相关信息,包含每一次迁移的操作员、操作时间、操作动作、迁移耗时等,这样便于管理员全面掌握虚拟机迁移信息,加强虚拟机管理。

图4虚拟机迁移历史记录

二、资源精细化监控

在虚拟化环境中,会有很多虚拟机共享同一台物理主机的资源,物理主机故障会影响到该主机上运行的所有虚拟机,所以及时、准确的监控资源使用情况非常重要。CAS能在非常短的时间内收集到资源池所有的性能数据、并处理、归档到后台数据库。在虚拟机内部操作系统内安装CAS Tools监控模块,可以有效地保证这些性能数据的准确性,管理员通过观察CAS管理界面中的性能图表来获取这些性能统计信息,对性能进行实时监控。

l物理主机性能监控

如图所示CAS通过仪表盘的形式来展示物理主机的CPU、内存、网络、存储等资源的使用情况,并提供详细的报表,管理员可利用监控数据决定物理主机的负载,来判断是否让更多虚拟机整合在这台物理主机上;同时也能检测主机的可用性问题并提前预知风险。

图5物理主机概要信息

l虚拟机性能监控

CAS可以对虚拟机CPU、内存、网络、磁盘I/O、IOPS、I/O延时和分区利用率等多项关键指标的监控,通过持续监控虚拟机负载,发现资源利用率较低的虚拟机,可以将此虚机的剩余资源回收到资源池供其他虚拟机使用,最大限度的提高资源利用率;同时利用基于时间轴曲线的图表预测资源性能瓶颈,发现资源不足的虚拟机,及时分配资源来保障虚拟机流畅地运行。

l资源使用情况统计

CAS可对资源的使用情况进行细致的统计,包括主机、虚拟机、网络资源(IP地址)等信息。用户可以根据自身需求灵活定制报表显示的内容,并可将报表信息导出,帮助工程师了解当前资源的使用情况,为业务扩容优化提供量化数据。

图6虚拟机报表统计

三、业务系统可用性监控

传统虚拟化平台的监控往往只是对资源使用情况的监控,没法监控到虚拟机上运行的业务,而IT管理者更为关注的是业务的运行情况。因此CAS在满足资源监控的基础上,增加了业务系统的可用性检测。

利用CAS Tools的业务监控模块可实时监控业务系统进程的状态,通过Tools中的虚拟串口通道保持与CAS管理平台的实时通信,判定业务的存活状态。如果在连续3个时间周期(1个周期为30秒)内探测到被监测的服务状态为非运行或非活跃状态,则自动重启该服务,如果连续4个时间周期检测到应用服务故障,且重启服务失败,则根据系统管理员配置的业务监控策略,重新启动虚拟机或仅上报应用故障不可恢复的告警消息,最小化业务宕机时间。目前可监控的业务类型包括Apache Tomcat、JDK、Apache HTTP Server、MySQL、SQL Server、SharePoint等应用,并支持用户自定义脚本配置业务监控系统来增加所需要的监控项。

四、完善的告警与审计

对于虚拟化环境的监控管理而言,告警是一个最基础且最关键的需求。告警涉及的范围包括总体状况重大告警、集群资源利用率告警、主机资源利用率告警、虚拟机资源利用率告警、网络连通性告警、存储连通性告警等多项内容。系统管理员希望各类异常告警的统计信息及其产生的原因与故障恢复手段都在虚拟化平台直观地展示出来,作为决策依据。

CAS针对集群、物理主机、虚拟机的资源使用情况进行监控,支持自定义CPU、内存、磁盘利用率的告警阈值。当设置的监控指标数值达到设定阈值时,系统会自动上报告警。平台根据设置阈值数值的不同,将告警信息划分为紧急告警、重要告警、次要告警、提示告警。第一时间以短信、邮件等多种方式将异常通知给管理员,以便管理员及时处理,快速解决这些问题,将风险与损失降到最低。同时CAS对系统告警及管理员处理进行日志详细记录,方便事后审计追踪。

总结

随着信息化的发展,虚拟化逐渐成为数据中心的标配,虚拟化后带来的监控问题成为最为突出的管理需求。H3C CAS虚拟化平台通过内置的健康度评价模型,从软硬件的各个层面全面评估虚拟化系统的健康程度,对资源池整体容量、运行情况进行直观展示和分析,辅以计算、网络和存储资源的精细化的性能状态、资源告警、环境拓扑、业务系统状态等关键信息的监控,从资源和业务两个维度实现虚拟化环境的监控,保证虚拟化平台的稳定运行。

虚拟服务器连接监控,方案:浅谈虚拟化平台的监控管理相关推荐

  1. 浅谈虚拟化技术下的云安全如何处置

    浅谈虚拟化技术下的云安全如何处置 近年来,云计算是目前非常热门的一个研究领域,其实它并不是一种全新的技术,而是许多技术的融合体,包括分布式计算.动态和拓展等各种各样的技术算法,而虚拟化技术是云计算里最 ...

  2. 智能循迹小车_校园智能车障碍断路方案浅谈

    点击上方蓝字 关注小黑记事本 小黑提要: 华软嵌协举办的第十届校园智能车比赛即将开赛,组委会今年在赛道元素上进行了一次大创新,加入了没有出现过的障碍与断路新元素,对于参赛的选手是一个不小的挑战,而选手 ...

  3. 关于密码的那些事儿—浅谈密码的设计与管理

    这是整理于2011年底的一份报告材料. 介绍1.背景 2011年底,国内遭遇网络安全的"崩盘".从CSDN用户数据被爆库,到天涯用户信息被刷库,到众多社交网站.论坛用户数据被拖库, ...

  4. 浅谈Oracle RAC --集群管理软件GI

    浅谈Oracle RAC --集群管理软件GI基本架构 今天周五,想想可以过周末,心情大好.一周中最喜欢过的就是周五晚上,最不喜欢过的是周日晚上和周一,看来我不是个热爱劳动的人啊.趁着现在心情愉悦,赶 ...

  5. 浙江浪潮服务器虚拟化,浪潮四路服务器构建浙江泰隆商行虚拟化平台案例

    虚拟化升级由浪潮助力 --浪潮四路服务器构建浙江泰隆商行虚拟化平台 [导语]浙江泰隆商业银行作为浙江省内有名的股份制商业银行,主要从事小微企业金融服务器,多年来发展势头良好,业务和规模都在不断扩展.原 ...

  6. 浅谈​与彼得原理和责任管理有关的小故事

    浅谈与彼得原理和责任管理有关的小故事 一) 老王虽然今年才3年工作经验,但一直深受领导赏识,因为在大家眼里他是一个责任心特别强的人.无论是领导也好,同事也好,只要有任务安排给他,他都会非常欣然的接受, ...

  7. 浅谈大数据的标签管理

    最近参与了一个大数据的项目,是涉及标签管理方面的内容,使我这个初涉入大数据领域的人获益匪浅. 标签,也可以叫做Tag,最早出现于2005年(注1),随着Web2.0的Blog应用被广泛使用开来.标签也 ...

  8. 华为云工程师HCIA——华为虚拟化平台使用与管理

    一.FusionCompute计算虚拟化介绍 1.计算虚拟化相关概念 1.1.虚拟化介绍虚拟化介绍 1.2.虚拟化的特点(反过来考定义也要会) •分区:分区意味着虚拟化层为多个虚拟机划分服务器资源的能 ...

  9. 浅谈智慧校园能源监控系统的设计

    摘要 基于网络通讯技术,搭建校园能源实时在线监控平台.对南京技师学院重点耗能楼宇或设备的关键参数实施在线采集及分析.同时具备采集数据打包上传.原始数据处理与存储.统计数据查询与分析.能耗数据对外发布与 ...

  10. 校园服务器系统的意义,浅谈校园网络建设的意义与作用.doc

    PAGE PAGE 7 浅谈校园网络建设的意义和作用 摘要:本文围绕校园网建设的意义和作用.结合本校校园网建设的基本经验,运用大量具体实例阐述大力建设校园网络的必要性和可行性,供大家借鉴. 关键字:校 ...

最新文章

  1. mqttnet 详解_MQTTnet 3.0.5学习笔记
  2. 华为鸿蒙系统手机销量,两个品牌助力华为新生,但最终会是谁拯救谁
  3. C++ 出版公司(继承)
  4. 《C和指针》学习备忘
  5. python3 tkinter
  6. 程序员的800字作文
  7. 牛客网多校联合训练1 J Different Integers(可持久化线段树/莫队)
  8. RHEL 8 - 用podman/buildah/skopeo构建systemd级别运行容器
  9. java中中的赋值运算符_Java中的赋值运算符
  10. Linux下硬盘性能测试
  11. F5讲坛:虚拟化数据中心的安全问题-F5白皮书
  12. Flyod和Warshall
  13. 《21天学通Java(第6版)》—— 1.7 问与答
  14. 【预测模型-ELAMN预测】基于遗传算法优化ELMAN神经网络实现数据回归预测matlab代码
  15. C++二进制数转换十进制数
  16. 基于Java+Springboot+Vue校园志愿者管理系统设计与实现
  17. Navigator的正确打开方式
  18. 基于SSM+SpringBoot+MySQL+LayUI的高校学生评教系统
  19. 彻底破解加密PDF文件
  20. 如何打包浏览器的扩展程序

热门文章

  1. PowerBuilder从入门到精通(PB12.5)
  2. netperf测试工具
  3. 如何在html中使用特殊字体
  4. android 资源id 闪退,【报Bug】android闪退,勾选Push消息推送自定义基座后 获取oaid,vaid,aaid, app闪退...
  5. 游戏开发者,游戏开发教程
  6. 整理了20个数据可视化大屏,源码限时领取!
  7. ABBYY软件对PDF文本审阅操作之盖章
  8. python打印网页成pdf_如何使用Python将网页转换为PDF
  9. [CISCN2019 总决赛 Day2 Web1]Easyweb
  10. CAD中插入外部参照字体会变繁体_什么是CAD的形文件,它与字体文件有什么区别?...