浅析IT运维监控技术
随着网络的快速发展,各大运营商们由于业务的多样性部署了数以万计的IT设备,其设备类别、厂家、型号繁杂,仅仅靠现场运维团队人工巡检不仅不能满足业务需求,还加重了人工成本,因此需要一套成熟的面向大型数据中心的IT监控系统来支撑日常运维工作。
一、什么是IT运维监控
通常我们将IT设备分类为:主机、数通、存储、系统、数据库,中间件等,此外还包括虚拟化、云化以及物联网的的一些设备,而IT运维监控是指一种通过技术手段收集IT设备的指标来保证系统以及业务正常运行的管理软件。
二、IT运维监控分类
1、基于监控指标的描述对象可分为硬件级监控和系统级监控:
(1)硬件级监控:主要采集设备的一些固件信息(厂商、大小、序列号等)以及工作状态指标(温度、转速、电压、在位状态等)。
(2)系统级监控:主要采集操作系统、中间件、应用的一些运行信息(CPU、内存、磁盘利用率等)。
2、基于监控指标的采集方式可分为带外指标监控和带内指标监控:
(1)带外指标监控:通过专门的硬件管理接口,采集带外监控指标。
(2)带内指标监控:通过在监控对象部署插件或者网络协议来采集带内监控指标。
三、常用监控技术
1、带外采集
(1)IPMI监控
独立在操作系统之外运行的一套管理系统,依赖于特殊的硬件模块,即使业务操作系统未加载或宕机,依然可以工作。由于IPMI协议制定相对简单,各个厂商在标准上扩展了很多实用的功能,但是扩展的功能缺少统一标准,采集命令和解析规则大多不通用,增加了监控方的采集难度。
常用的一些命令包括:ipmitool…fru、ipmitool…sdr、ipmcget、show等。此外还可以通过SSH协议登录到IPMI管理操作系统中执行采集指令。
(2)RedFish
由于IPMI较差的扩展性和本身存在的安全隐患,IPMI也在2015年公布2.0 v1.1标准后,不再更新,被RedFish永久代替,Intel也宣布不再维护。RedFish是一种基于HTTPs服务的管理标准。具有安全、高可扩展管理(Scalable)、人类可读数据界面(Human readable data)、基于现有硬件可实现等特性。
2、带内采集
(1)Agent监控
Agent监控是通过在被监控对象上部署一套插件来监控系统各项指标。Agent可自主完成指标采集和简单分析后再将结果传送给server端,降低了服务端的数据处理工作量和性能要求。主要用于对虚拟机和数据库的采集。由server代理采集中心的任务分发与节点控制,通过分布式架构,实现便捷的横向扩展采集能力。
(2)SNMP协议
SNMP协议主要是针对网络设备的一种采集技术,跟IPMI一样,各个厂商型号的设备对于MIB库的支持和扩展都有较大差别,不同指标的定义也会提升监控的难度。
(3)SSH /Telnet协议
通过SSH /Telnet协议连接到被监控设备,再执行采集命令或运行脚本并传输运行结果到监控端实现监控,这种方式灵活度较大,但存在一定的操作安全隐患。
四、总结
IT运维监控技术有效缓解了IT系统数量多、系统复杂度高等问题,大大提高了运维工作人员的工作效率。未来,IT运维监控技术势必会与AI技术相融合,借助AI技术实现运维智能化、高效化和高质量发展。
浅析IT运维监控技术相关推荐
- 浅析变电运维监控技术的研究与应用
张宇然 安科瑞电气股份有限公司 上海嘉定 201801 [摘要]随着我们国家的不断发展,科学技术的不断进步,我们生活中已经不能缺少电力.而变电站作为电力生产中的重要环节,为了保证人们生产生活用电的稳定 ...
- 运维技能定级标准第3篇——关于运维工程师岗位的运维监控与MySQL数据库技能级别设计
运维工程师岗位工作技能的评定类别(3)和(4) 3.运维监控技术 级别0,什么都不懂 级别1,常见监控工具或软件系统的基本安装.配置.使用,照猫画虎会使用而已. 级别2,熟悉监控系统的基本原理和常用配 ...
- 智能运维监控管理平台技术方案
目 录 1 项目概况 7 1.1 项目背景 7 2 现状概述 7 2.1 当前现状分析 7 2.2 当前面临的运维问题 7 3 需求分析 8 3.1 传统运维工具局限性 8 3.2 具体需求分析 8 ...
- 乐维百科:八大开源运维监控软件浅析
前面的乐维百科文章介绍了什么是IT监控.为什么IT运维需要监控及如何监控的问题,接下来我们来看一下常见的开源监控软件. 之所以特别强调开源监控,是因为在运维监控的实际应用中,开源监控平台占据了很大一部 ...
- HAWQ技术解析(十六) —— 运维监控
与任何IT系统一样,为了保证HAWQ集群的高可用和高性能,需要进行一系列监控与维护活动.本篇讨论HAWQ推荐的运维与监控活动. 一.推荐的监控与维护任务 表1至表5是HAWQ向系统管理员推荐定期执行的 ...
- mongodb 监控权限_运维监控产品分析篇
开源运维监控系统篇 1.zabbix 用户群:85%以上的泛互联网企业. 优点:支持多平台的企业级分布式开源监控软件 安装部署简单,多种数据采集插件灵活集成 功能强大,可实现复杂多条件告警, 自带画图 ...
- Yurt-Tunnel 详解|如何解决 K8s 在云边协同下的运维监控挑战
简介: 伴随着 5G.IoT 等技术的快速发展,边缘计算被越来越广泛地应用于电信.媒体.运输.物流.农业.零售等行业和场景中,成为解决这些领域数据传输效率的关键方式.与此同时,边缘计算形态.规模.复杂 ...
- 众安运维监控平台,构建devops一体化监控和运维体系
当前,企业运维监控的难度日益增大,缺乏统一性.集成化.灵活性的运维管理已经无法适用当前的工作要求,运维人员往往需要使用多个不同的监控系统,容易造成无法及时发现和处理问题的情况,不但增加了工作负担和成本 ...
- 建设DevOps统一运维监控平台,全面的系统监控你做好了吗?
本文转自微信号EAWorld.扫描下方二维码,关注成功后,回复"普元方法+",将会获得热门课堂免费学习机会! 前言 随着Devops.云计算.微服务.容器等理念的逐步落地和大力发展 ...
最新文章
- 2020 China Collegiate Programming Contest Changchun 	F - Strange Memory(dsu on tree + 位运算小技巧)
- 细说JavaScript中对象的属性和方法
- 大数据风控之信贷审查的5大步骤及要点
- 电话聊天狂人 (25 分)【简便解法】
- matlab 矩阵与向量乘,matlab问题,关于矩阵向量的乘问题
- django-模板的母版与子版
- Android 出现警告Exported service does not require permission
- php 类 和 函数,PHP函数和类
- 78-spark2.2的编译
- ACM--素数距离问题
- C#|GMap.NET控件基本使用-高德地图
- 美信科技监控易:智慧高校一体化综合监控解决方案
- 也致第一次安装Rime的你
- oracle查看锁表语句、解锁方法
- uniapp——如何在项目中使用阿里字体图标
- 数字版权保护(Digital Right Management,DRM)
- 300多张电脑壁纸打包下载,高清电脑壁纸
- boot版本是什么 cent os_Cent OS 7系统目录结构
- MFC Windows程序设计学习笔记--文件和串行化
- linux原生安装postgresgl