随着网络的快速发展,各大运营商们由于业务的多样性部署了数以万计的IT设备,其设备类别、厂家、型号繁杂,仅仅靠现场运维团队人工巡检不仅不能满足业务需求,还加重了人工成本,因此需要一套成熟的面向大型数据中心的IT监控系统来支撑日常运维工作。

一、什么是IT运维监控

通常我们将IT设备分类为:主机、数通、存储、系统、数据库,中间件等,此外还包括虚拟化、云化以及物联网的的一些设备,而IT运维监控是指一种通过技术手段收集IT设备的指标来保证系统以及业务正常运行的管理软件。

二、IT运维监控分类

1、基于监控指标的描述对象可分为硬件级监控和系统级监控:

(1)硬件级监控:主要采集设备的一些固件信息(厂商、大小、序列号等)以及工作状态指标(温度、转速、电压、在位状态等)。

(2)系统级监控:主要采集操作系统、中间件、应用的一些运行信息(CPU、内存、磁盘利用率等)。

2、基于监控指标的采集方式可分为带外指标监控和带内指标监控:

(1)带外指标监控:通过专门的硬件管理接口,采集带外监控指标。

(2)带内指标监控:通过在监控对象部署插件或者网络协议来采集带内监控指标。

三、常用监控技术

1、带外采集

(1)IPMI监控

独立在操作系统之外运行的一套管理系统,依赖于特殊的硬件模块,即使业务操作系统未加载或宕机,依然可以工作。由于IPMI协议制定相对简单,各个厂商在标准上扩展了很多实用的功能,但是扩展的功能缺少统一标准,采集命令和解析规则大多不通用,增加了监控方的采集难度。

常用的一些命令包括:ipmitool…fru、ipmitool…sdr、ipmcget、show等。此外还可以通过SSH协议登录到IPMI管理操作系统中执行采集指令。

(2)RedFish

由于IPMI较差的扩展性和本身存在的安全隐患,IPMI也在2015年公布2.0 v1.1标准后,不再更新,被RedFish永久代替,Intel也宣布不再维护。RedFish是一种基于HTTPs服务的管理标准。具有安全、高可扩展管理(Scalable)、人类可读数据界面(Human readable data)、基于现有硬件可实现等特性。

2、带内采集

(1)Agent监控

Agent监控是通过在被监控对象上部署一套插件来监控系统各项指标。Agent可自主完成指标采集和简单分析后再将结果传送给server端,降低了服务端的数据处理工作量和性能要求。主要用于对虚拟机和数据库的采集。由server代理采集中心的任务分发与节点控制,通过分布式架构,实现便捷的横向扩展采集能力。

(2)SNMP协议

SNMP协议主要是针对网络设备的一种采集技术,跟IPMI一样,各个厂商型号的设备对于MIB库的支持和扩展都有较大差别,不同指标的定义也会提升监控的难度。

(3)SSH /Telnet协议

通过SSH /Telnet协议连接到被监控设备,再执行采集命令或运行脚本并传输运行结果到监控端实现监控,这种方式灵活度较大,但存在一定的操作安全隐患。

四、总结

IT运维监控技术有效缓解了IT系统数量多、系统复杂度高等问题,大大提高了运维工作人员的工作效率。未来,IT运维监控技术势必会与AI技术相融合,借助AI技术实现运维智能化、高效化和高质量发展。

浅析IT运维监控技术相关推荐

  1. 浅析变电运维监控技术的研究与应用

    张宇然 安科瑞电气股份有限公司 上海嘉定 201801 [摘要]随着我们国家的不断发展,科学技术的不断进步,我们生活中已经不能缺少电力.而变电站作为电力生产中的重要环节,为了保证人们生产生活用电的稳定 ...

  2. 运维技能定级标准第3篇——关于运维工程师岗位的运维监控与MySQL数据库技能级别设计

    运维工程师岗位工作技能的评定类别(3)和(4) 3.运维监控技术 级别0,什么都不懂 级别1,常见监控工具或软件系统的基本安装.配置.使用,照猫画虎会使用而已. 级别2,熟悉监控系统的基本原理和常用配 ...

  3. 智能运维监控管理平台技术方案

    目 录 1 项目概况 7 1.1 项目背景 7 2 现状概述 7 2.1 当前现状分析 7 2.2 当前面临的运维问题 7 3 需求分析 8 3.1 传统运维工具局限性 8 3.2 具体需求分析 8 ...

  4. 乐维百科:八大开源运维监控软件浅析

    前面的乐维百科文章介绍了什么是IT监控.为什么IT运维需要监控及如何监控的问题,接下来我们来看一下常见的开源监控软件. 之所以特别强调开源监控,是因为在运维监控的实际应用中,开源监控平台占据了很大一部 ...

  5. HAWQ技术解析(十六) —— 运维监控

    与任何IT系统一样,为了保证HAWQ集群的高可用和高性能,需要进行一系列监控与维护活动.本篇讨论HAWQ推荐的运维与监控活动. 一.推荐的监控与维护任务 表1至表5是HAWQ向系统管理员推荐定期执行的 ...

  6. mongodb 监控权限_运维监控产品分析篇

    开源运维监控系统篇 1.zabbix 用户群:85%以上的泛互联网企业. 优点:支持多平台的企业级分布式开源监控软件 安装部署简单,多种数据采集插件灵活集成 功能强大,可实现复杂多条件告警, 自带画图 ...

  7. Yurt-Tunnel 详解|如何解决 K8s 在云边协同下的运维监控挑战

    简介: 伴随着 5G.IoT 等技术的快速发展,边缘计算被越来越广泛地应用于电信.媒体.运输.物流.农业.零售等行业和场景中,成为解决这些领域数据传输效率的关键方式.与此同时,边缘计算形态.规模.复杂 ...

  8. 众安运维监控平台,构建devops一体化监控和运维体系

    当前,企业运维监控的难度日益增大,缺乏统一性.集成化.灵活性的运维管理已经无法适用当前的工作要求,运维人员往往需要使用多个不同的监控系统,容易造成无法及时发现和处理问题的情况,不但增加了工作负担和成本 ...

  9. 建设DevOps统一运维监控平台,全面的系统监控你做好了吗?

    本文转自微信号EAWorld.扫描下方二维码,关注成功后,回复"普元方法+",将会获得热门课堂免费学习机会! 前言 随着Devops.云计算.微服务.容器等理念的逐步落地和大力发展 ...

最新文章

  1. 2020 China Collegiate Programming Contest Changchun F - Strange Memory(dsu on tree + 位运算小技巧)
  2. 细说JavaScript中对象的属性和方法
  3. 大数据风控之信贷审查的5大步骤及要点
  4. 电话聊天狂人 (25 分)【简便解法】
  5. matlab 矩阵与向量乘,matlab问题,关于矩阵向量的乘问题
  6. django-模板的母版与子版
  7. Android 出现警告Exported service does not require permission
  8. php 类 和 函数,PHP函数和类
  9. 78-spark2.2的编译
  10. ACM--素数距离问题
  11. C#|GMap.NET控件基本使用-高德地图
  12. 美信科技监控易:智慧高校一体化综合监控解决方案
  13. 也致第一次安装Rime的你
  14. oracle查看锁表语句、解锁方法
  15. uniapp——如何在项目中使用阿里字体图标
  16. 数字版权保护(Digital Right Management,DRM)
  17. 300多张电脑壁纸打包下载,高清电脑壁纸
  18. boot版本是什么 cent os_Cent OS 7系统目录结构
  19. MFC Windows程序设计学习笔记--文件和串行化
  20. linux原生安装postgresgl

热门文章

  1. 一头扎进Maven3 (一)
  2. Sharding-JDBC概述
  3. 网格布局(Grid)
  4. 给大家整理了几个好用的远程软件真实测评,大学生和打工人必备~用好远程,效率翻倍【建议收藏】
  5. 漫画说算法--动态规划算法一(绝对通俗易懂,非常棒)
  6. ping www.baidu.com出现www.a.shifen.com
  7. 能生成Deepfake也能诊断癌症,GAN与恶的距离
  8. 【Linux】实验报告8 Linux文件系统
  9. vue el-table 动态添加行、删除行
  10. 大数据学习——HDFS退役旧数据节点