软件运维监控有哪些?
监控是程序员在维护软件运行的时候需要依赖的一个功能,而今天我们就通过案例分析来了解一下,软件运维监控都有哪些指标类型。
1、指标
通常监控指标是会从系统、应用、业务等几个维度进行:
系统监控:主要是监控物理机、虚拟机、操作系统的运行情况,主要指标包括CPU、内存、磁盘、网络等,其他的一些相关的数据包括物理机运行时间、操作系统版本、操作系统内核,这些也是排查问题的一些基本依据。这里还需要重点说一下网络,微服务都是通过网络调用或被调用,一旦网络出现问题,整个微服务集群都是不可用的,所以网络监控需要细化到流量、数据包、丢包、错报、连接数等指标。
应用监控:主要是监控应用的运行情况,包括应用运行时间、http服务端口、服务url、http服务响应码、http服务响应时间、SQL、缓存命中、TPS、QPS等。对于Java应用,还需要包括JVM运行情况:JDK版本、内存使用(堆内存、非堆内存等)、GC等Java虚拟机运行情况。
业务监控:主要是监控一些核心业务执行情况,对业务有一定的侵入性,各个服务的指标不同,各家监控方式也不同,通常是埋码。比如监控登录注册、商品信息、库存情况、下单、支付、发货等各个业务。
2、健康
一般健康检查是通过心跳检测进行的,通常会分为两种:
一种是建立TCP链接,执行ping/pong调用。这种方式需要服务中与监控系统建立TCP链接,需要在服务中嵌入监控组件,对服务有侵入。但是因为其执行效率高,而且针对性强,不会出现漏报的情况。
一种是监听服务端口,这种方式只需要在容器内或者虚拟机增加监控插件,对服务没什么侵入,但是由于端口可用和服务可用不是一个概念,所以会出现漏报的情况。
3、异常收集
异常分成两种,逻辑异常和行为异常。逻辑异常是说代码中存在异常逻辑,比如常见的NPE;行为异常时用户行为不可预期而出现的异常,这两种情况对系统都有一定危害。所以需要收集这些异常情况,并且能够定位异常发生的位置。异常信息收集主要是为了定位问题,所以上报的信息一定要全面而且容易定位。所以上报信息中需要保护异常码,可以自定义一定长度的字符串,便于定位位置。然后是要上报参数,用于还原现场。还要上报异常信息,用来分析异常情况。
软件运维监控有哪些?相关推荐
- 开源运维管理软件排名_企业运维监控平台架构设计与实现(ganglia篇)
一.Cacti/Nagios/Zabbix/centreon/Ganglia之抉择 1.cacti Cacti是一套基于PHP,MySQL,SNMP及RRDTool开发的网络流量监测图形分析工具. 简 ...
- 运维监控软件的选择对比----Zabbix vs Prometheus
近期遇到项目需要定制开发运维监控软件,考虑到监控的规模比较大,数量比较多,所以不能随随便便找个开源的监控软件就能应付了事的,还是要认真对待. N年以前笔者曾经使用过Nagios,catti以及MRTG ...
- 乐维百科:八大开源运维监控软件浅析
前面的乐维百科文章介绍了什么是IT监控.为什么IT运维需要监控及如何监控的问题,接下来我们来看一下常见的开源监控软件. 之所以特别强调开源监控,是因为在运维监控的实际应用中,开源监控平台占据了很大一部 ...
- oracle根据记录添加bsm,【运维监控系统 PIGOSS BSM 】免费在线试用_软件库_选软件网...
运维管理系统 PIGOSS BSM 不仅可以关联对业务云服务的监控,同时也基于与复杂异构的IT基础架构监控指标建立关联,针对服务器操作系统,数据库,中间件,webserver,企业应用.网络设备.网络 ...
- 企业运维监控平台架构设计与实现
课程介绍 本课程主要介绍了企业常见的运维监控平台的构建思路和常用软件,讲述了cacti.nagios.zabbix.ganglia.webnagios等常用监控软件的差异和优劣,并深入介绍了通过gan ...
- 基于Linux+Nagios+Centreon+Nagvis等构建海量运维监控系统
参考书目:<海量运维监控系统规划与部署 基于Linux+Nagios+Centreon+Nagvis等> 付哲著 系统环境规划: 基于阿里云centos6.8镜像升级到centos6.9, ...
- Lunx运维监控_shark巨菜_基础篇
Lunx运维监控_shark巨菜_基础篇 一.监控重要性 单单从"监控"两个字来谈,范围之广可以涵盖我们生活的方方面面,我们生活和工作中处处可见视频监控的摄像机:机房中的电压电流监 ...
- mongodb 监控权限_运维监控产品分析篇
开源运维监控系统篇 1.zabbix 用户群:85%以上的泛互联网企业. 优点:支持多平台的企业级分布式开源监控软件 安装部署简单,多种数据采集插件灵活集成 功能强大,可实现复杂多条件告警, 自带画图 ...
- python 运维管理架构_企业运维监控平台架构设计与实现(ganglia篇)
一.Cacti/Nagios/Zabbix/centreon/Ganglia之抉择 1.cacti Cacti是一套基于PHP,MySQL,SNMP及RRDTool开发的网络流量监测图形分析工具. 简 ...
- 运维监控系统实战笔记(day1)
第一次课 监控需求直接的是为了出现问题时能及时感知到.新的需求: 通过监控了解数据趋势,知道系统在未来的某个时刻可能出问题,预知问题. 通过监控了解系统的水位情况,为服务扩缩容提供数据支撑. 通过监控 ...
最新文章
- 10. JavaScript学习笔记——JSON
- java spring 集成定时器
- 最全的数据结构解析与归纳
- php 批量压缩png,利用Python批量压缩png方法实例(支持过滤个别文件与文件夹)...
- Caffe cuDNN
- Android Studio自定义模板 做开发竟然可以如此轻松 后篇
- Could not retrieve transaction isolation level from server
- 4.4GDI基本图形
- Java请求参数检查,Java如何检查servlet请求中是否存在参数?
- Win7_D旗舰版_201906 twm000出品
- 软件资产管理重在license
- 左右滑屏设置_android手势滑屏及左右滑屏
- 建模学习—带你轻松认识并掌握3Dmax
- 茄子总结31/8/2022
- 量子计算到底是什么?
- 名帖318 沈尹默 行书《行书帖选》
- webstorm html代码提示设置,Webstorm设置代码提示
- [hdu 5671][BestCoder Round #81 t2] Matrix
- 两个独立同分布且元素独立同分布的序列相加
- 暴风激活劫持浏览器主页
热门文章
- java yaml_Java 使用snakeyaml解析yaml
- trados 有道api_塔多思翻译附插件下载-外语准确机翻工具插件(TRADOS)下载2019版-西西软件下载...
- default、mms、supl、dun、hipri接入点类型的区别
- matlab物探版,s4m matlab中画地震图件的子程序源代码,对物探人员很有用。 238万源代码下载- www.pudn.com...
- 03惯性导航系统误差分析
- Matlab三位曲线之plot3函数
- linux 控制音量大小,linux 控制音量大小
- html 组件化 编辑器,纯前端表格控件SpreadJS V14.0发布:组件化编辑器+数据透视表...
- VMware——VMware Tools的介绍及安装方法
- 汇编语言典型例子详解_汇编语言例子