监控是程序员在维护软件运行的时候需要依赖的一个功能,而今天我们就通过案例分析来了解一下,软件运维监控都有哪些指标类型。

1、指标

通常监控指标是会从系统、应用、业务等几个维度进行:

系统监控:主要是监控物理机、虚拟机、操作系统的运行情况,主要指标包括CPU、内存、磁盘、网络等,其他的一些相关的数据包括物理机运行时间、操作系统版本、操作系统内核,这些也是排查问题的一些基本依据。这里还需要重点说一下网络,微服务都是通过网络调用或被调用,一旦网络出现问题,整个微服务集群都是不可用的,所以网络监控需要细化到流量、数据包、丢包、错报、连接数等指标。

应用监控:主要是监控应用的运行情况,包括应用运行时间、http服务端口、服务url、http服务响应码、http服务响应时间、SQL、缓存命中、TPS、QPS等。对于Java应用,还需要包括JVM运行情况:JDK版本、内存使用(堆内存、非堆内存等)、GC等Java虚拟机运行情况。

业务监控:主要是监控一些核心业务执行情况,对业务有一定的侵入性,各个服务的指标不同,各家监控方式也不同,通常是埋码。比如监控登录注册、商品信息、库存情况、下单、支付、发货等各个业务。

2、健康

一般健康检查是通过心跳检测进行的,通常会分为两种:

一种是建立TCP链接,执行ping/pong调用。这种方式需要服务中与监控系统建立TCP链接,需要在服务中嵌入监控组件,对服务有侵入。但是因为其执行效率高,而且针对性强,不会出现漏报的情况。

一种是监听服务端口,这种方式只需要在容器内或者虚拟机增加监控插件,对服务没什么侵入,但是由于端口可用和服务可用不是一个概念,所以会出现漏报的情况。

3、异常收集

异常分成两种,逻辑异常和行为异常。逻辑异常是说代码中存在异常逻辑,比如常见的NPE;行为异常时用户行为不可预期而出现的异常,这两种情况对系统都有一定危害。所以需要收集这些异常情况,并且能够定位异常发生的位置。异常信息收集主要是为了定位问题,所以上报的信息一定要全面而且容易定位。所以上报信息中需要保护异常码,可以自定义一定长度的字符串,便于定位位置。然后是要上报参数,用于还原现场。还要上报异常信息,用来分析异常情况。

软件运维监控有哪些?相关推荐

  1. 开源运维管理软件排名_企业运维监控平台架构设计与实现(ganglia篇)

    一.Cacti/Nagios/Zabbix/centreon/Ganglia之抉择 1.cacti Cacti是一套基于PHP,MySQL,SNMP及RRDTool开发的网络流量监测图形分析工具. 简 ...

  2. 运维监控软件的选择对比----Zabbix vs Prometheus

    近期遇到项目需要定制开发运维监控软件,考虑到监控的规模比较大,数量比较多,所以不能随随便便找个开源的监控软件就能应付了事的,还是要认真对待. N年以前笔者曾经使用过Nagios,catti以及MRTG ...

  3. 乐维百科:八大开源运维监控软件浅析

    前面的乐维百科文章介绍了什么是IT监控.为什么IT运维需要监控及如何监控的问题,接下来我们来看一下常见的开源监控软件. 之所以特别强调开源监控,是因为在运维监控的实际应用中,开源监控平台占据了很大一部 ...

  4. oracle根据记录添加bsm,【运维监控系统 PIGOSS BSM 】免费在线试用_软件库_选软件网...

    运维管理系统 PIGOSS BSM 不仅可以关联对业务云服务的监控,同时也基于与复杂异构的IT基础架构监控指标建立关联,针对服务器操作系统,数据库,中间件,webserver,企业应用.网络设备.网络 ...

  5. 企业运维监控平台架构设计与实现

    课程介绍 本课程主要介绍了企业常见的运维监控平台的构建思路和常用软件,讲述了cacti.nagios.zabbix.ganglia.webnagios等常用监控软件的差异和优劣,并深入介绍了通过gan ...

  6. 基于Linux+Nagios+Centreon+Nagvis等构建海量运维监控系统

    参考书目:<海量运维监控系统规划与部署 基于Linux+Nagios+Centreon+Nagvis等> 付哲著 系统环境规划: 基于阿里云centos6.8镜像升级到centos6.9, ...

  7. Lunx运维监控_shark巨菜_基础篇

    Lunx运维监控_shark巨菜_基础篇 一.监控重要性 单单从"监控"两个字来谈,范围之广可以涵盖我们生活的方方面面,我们生活和工作中处处可见视频监控的摄像机:机房中的电压电流监 ...

  8. mongodb 监控权限_运维监控产品分析篇

    开源运维监控系统篇 1.zabbix 用户群:85%以上的泛互联网企业. 优点:支持多平台的企业级分布式开源监控软件 安装部署简单,多种数据采集插件灵活集成 功能强大,可实现复杂多条件告警, 自带画图 ...

  9. python 运维管理架构_企业运维监控平台架构设计与实现(ganglia篇)

    一.Cacti/Nagios/Zabbix/centreon/Ganglia之抉择 1.cacti Cacti是一套基于PHP,MySQL,SNMP及RRDTool开发的网络流量监测图形分析工具. 简 ...

  10. 运维监控系统实战笔记(day1)

    第一次课 监控需求直接的是为了出现问题时能及时感知到.新的需求: 通过监控了解数据趋势,知道系统在未来的某个时刻可能出问题,预知问题. 通过监控了解系统的水位情况,为服务扩缩容提供数据支撑. 通过监控 ...

最新文章

  1. 10. JavaScript学习笔记——JSON
  2. java spring 集成定时器
  3. 最全的数据结构解析与归纳
  4. php 批量压缩png,利用Python批量压缩png方法实例(支持过滤个别文件与文件夹)...
  5. Caffe cuDNN
  6. Android Studio自定义模板 做开发竟然可以如此轻松 后篇
  7. Could not retrieve transaction isolation level from server
  8. 4.4GDI基本图形
  9. Java请求参数检查,Java如何检查servlet请求中是否存在参数?
  10. Win7_D旗舰版_201906 twm000出品
  11. 软件资产管理重在license
  12. 左右滑屏设置_android手势滑屏及左右滑屏
  13. 建模学习—带你轻松认识并掌握3Dmax
  14. 茄子总结31/8/2022
  15. 量子计算到底是什么?
  16. 名帖318 沈尹默 行书《行书帖选》
  17. webstorm html代码提示设置,Webstorm设置代码提示
  18. [hdu 5671][BestCoder Round #81 t2] Matrix
  19. 两个独立同分布且元素独立同分布的序列相加
  20. 暴风激活劫持浏览器主页

热门文章

  1. java yaml_Java 使用snakeyaml解析yaml
  2. trados 有道api_塔多思翻译附插件下载-外语准确机翻工具插件(TRADOS)下载2019版-西西软件下载...
  3. default、mms、supl、dun、hipri接入点类型的区别
  4. matlab物探版,s4m matlab中画地震图件的子程序源代码,对物探人员很有用。 238万源代码下载- www.pudn.com...
  5. 03惯性导航系统误差分析
  6. Matlab三位曲线之plot3函数
  7. linux 控制音量大小,linux 控制音量大小
  8. html 组件化 编辑器,纯前端表格控件SpreadJS V14.0发布:组件化编辑器+数据透视表...
  9. VMware——VMware Tools的介绍及安装方法
  10. 汇编语言典型例子详解_汇编语言例子