本文会来看一下Spring Boot Actuator提供给我们的监控端点Endpoint、健康检查Health和打点指标Metrics等所谓的Production-ready(生产环境必要的一些)功能。

监控端点

我们先来新建一个模块:

<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd"><modelVersion>4.0.0</modelVersion><groupId>me.josephzhu</groupId><artifactId>spring101-ops</artifactId><version>0.0.1-SNAPSHOT</version><packaging>jar</packaging><name>spring101-ops</name><description>Demo project for Spring Boot</description><parent><groupId>me.josephzhu</groupId><artifactId>spring101</artifactId><version>0.0.1-SNAPSHOT</version></parent><dependencies><dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-web</artifactId></dependency><dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-data-redis</artifactId></dependency><dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-actuator</artifactId></dependency></dependencies>
</project>
复制代码

引入了必要的actuator和web启动器,此外,还引入了data-redis启动器用于测试一些功能。 然后创建主程序:

package me.josephzhu.spring101ops;import org.springframework.boot.SpringApplication;
import org.springframework.boot.autoconfigure.SpringBootApplication;
import org.springframework.boot.web.client.RestTemplateBuilder;
import org.springframework.context.annotation.Bean;
import org.springframework.context.annotation.Configuration;
import org.springframework.web.client.RestTemplate;@SpringBootApplication
@Configuration
public class Spring101OpsApplication {public static void main(String[] args) {SpringApplication.run(Spring101OpsApplication.class, args);}@BeanRestTemplate restTemplate(RestTemplateBuilder builder){return builder.build();}
}
复制代码

创建一个测试Controller:

package me.josephzhu.spring101ops;import io.micrometer.core.instrument.MeterRegistry;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.data.redis.core.StringRedisTemplate;
import org.springframework.web.bind.annotation.GetMapping;
import org.springframework.web.bind.annotation.RequestMapping;
import org.springframework.web.bind.annotation.RequestParam;
import org.springframework.web.bind.annotation.RestController;import java.util.List;
import java.util.stream.Collectors;
import java.util.stream.IntStream;@RestController
@RequestMapping("api")
public class MyController {@AutowiredStringRedisTemplate stringRedisTemplate;@GetMapping("items")public List<MyItem> items(@RequestParam(value = "count",defaultValue = "10") int count){stringRedisTemplate.opsForValue().set("testKey", "value" + count);return IntStream.rangeClosed(1,count).mapToObj(i->new MyItem("name" + i,i)).collect(Collectors.toList());}
}
复制代码

这里有用到一个MyItem:

package me.josephzhu.spring101ops;import lombok.AllArgsConstructor;
import lombok.Data;@AllArgsConstructor
@Data
public class MyItem {private String name;private Integer price;
}
复制代码

最后配置一下application.properties:

management.server.port=8081
management.endpoints.web.exposure.include=*
management.endpoint.health.show-details=always
复制代码

这里做了几个配置:

  1. 修改actuator的访问端口为8081
  2. 开放所有的访问端点,引入Spring Security后可以对暴露的断点进行更多安全配置,生产环境不建议直接开启所有端点
  3. 健康检查端点显示详细信息,如果不展开显示详细信息,那么只会有一个总的状态信息

启动程序访问如下地址http://localhost:8081/actuator,可以看到页面列出了支持功能的链接,常用的有:

  1. auditevents:查看审计事件
  2. beans:查看Spring中的Bean清单
  3. conditions:查看Spring Boot自动配置匹配过程
  4. configprops:查看所有的配置
  5. env:查看Spring的ConfigurableEnvironment
  6. health:查看程序健康情况,后面细说
  7. httptrace:查看HTTP请求响应明细(默认100条)
  8. info:查看程序信息,后面细说
  9. loggers:查看日志配置,支持动态修改日志级别
  10. metrics:查看所有的metrics信息,后面细说
  11. mappings:查看MVC的@RequestMapping配置
  12. scheduledtasks:查看定时任务
  13. sessions:查看和删除用户session
  14. shutdown:优雅停止程序
  15. threaddump:线程Dump
  16. heapdump:下载GZIP压缩的hprof文件
  17. logfile:查看日志文件,需要先配置日志文件路径

还有一些其它的自带的端点,这里就不说了,比如用于数据迁移的flyway,用于给prometheus拉取metrics数据的端点,端点还可以自定义。 别小看这些功能,这些功能使得我们线上对应用程序进行运维可以很方便:

  1. 可以排查配置、环境问题
  2. 可以对线程Dump排查High CPU问题
  3. 可以对堆Dump排查Memory Leak问题
  4. 可以修改日志级别,排查程序问题
  5. 可以查看定时任务、RequestMapping等信息
  6. 可以让负载均衡器有统一的端口检查应用状态
  7. 可以暴露、收集、汇总程序内部的各种指标用于绘制监控面板
  8. 其它各种程序内部的信息

健康检查

先来访问/actuator/health重点看一下健康检查:

这里可以看到不但Spring Boot帮我们自动配置收集了redis和磁盘的监控信息,而且我们还自定义了一个叫做myService的检查项。这里因为我们程序有使用到Redis,所以自动配置了相应的检查,自动支持自动配置的HealthIndicator有下面这些(基本各种Spring Data支持的数据源都有了): 下面我们看一下如何自定义监控检查项:

package me.josephzhu.spring101ops;import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.boot.actuate.health.Health;
import org.springframework.boot.actuate.health.HealthIndicator;
import org.springframework.core.ParameterizedTypeReference;
import org.springframework.http.HttpMethod;
import org.springframework.http.ResponseEntity;
import org.springframework.stereotype.Component;
import org.springframework.web.client.RestTemplate;import java.util.List;@Component
public class MyServiceHealthIndicator implements HealthIndicator {@Autowiredprivate RestTemplate restTemplate;@Overridepublic Health health() {try {ResponseEntity<List<MyItem>> responseEntity =restTemplate.exchange("http://localhost:8080/api/items",HttpMethod.GET, null, new ParameterizedTypeReference<List<MyItem>>() {});if (responseEntity.getStatusCode().is2xxSuccessful())return Health.up().build();elsereturn Health.down().status(responseEntity.getStatusCode().toString()).build();} catch (Exception ex) {return Health.down(ex).build();}}
}
复制代码

实现很简单,实现HealthIndicator接口即可,我们的类是XXHealthIndicator,那么自动就会加入一个叫XX的项。在这里,我们访问了远程的一个服务,当服务出现非2XX的响应或调用服务出现异常的时候,我们认为这个服务的健康是DOWN的,否则就是UP状态。在down的时候我们可以传入状态、异常等补充信息,比如这是一个DOWN的情况:

因为某一项DOWN了,整个应用的状态认为是DOWN。 之前也说过,如果每一个程序都有统一的health入口可以监控程序状态的话,我们的负载均衡就可以依靠这个来做应用的故障下线。之所以我们需要定义自己的HealthIndicator加入是因为很多时候程序启动成功并不代表程序正常工作,程序是否真正工作正常往往依赖于外部的一些关键服务和内部的一些关键组件(线程池、队列等)。

应用信息

在本节中,我们来看一下如何进行简单配置实现暴露如下应用信息的功能:

  1. 通过配置方式暴露自定义的信息
  2. 通过程序方式暴露自定义的信息
  3. 暴露应用构建信息
  4. 暴露应用git版本信息 访问/actuator/info可以看到下面的信息: 在截图中第一项可以看到app这个JSON暴露了一些自定义的信息,我们可以在application.properties配置文件中加入这样的配置来实现:
info.app.name=Test SpringBoot Actuator
info.app.description=Test how to configure Health/Info/Metrics etc. with Spring Boot Actuator
info.app.version=1.0.1
info.app.author=JosephZhu
复制代码

截图中第二项可以看到git这个JSON暴露了程序git相关的信息,实现方式是加入一个插件到pom中:

<plugin><groupId>pl.project13.maven</groupId><artifactId>git-commit-id-plugin</artifactId><version>2.1.15</version>
</plugin>
复制代码

此外,如果需要查看git详细信息的话需要加入如下配置到配置文件:

management.info.git.mode=full
复制代码

截图中第三项可以看到build这个JSON暴露了程序构建一些信息,这个通过Spring Boot的maven插件就可以实现,加入build-info这个Goal来生成:

<plugin><groupId>org.springframework.boot</groupId><artifactId>spring-boot-maven-plugin</artifactId><executions><execution><goals><goal>build-info</goal></goals></execution></executions>
</plugin>
复制代码

我们使用maven运行一下这两个插件,可以看到编译后多了build-info.properties和git.properties,这也就是Actuator获取信息的来源:

截图中最后我们看到有一个key项的信息,这是我们通过程序定义的,实现方式是实现InfoContributor接口:

package me.josephzhu.spring101ops;import org.springframework.boot.actuate.info.Info;
import org.springframework.boot.actuate.info.InfoContributor;
import org.springframework.stereotype.Component;@Component
public class MyInfoContributor implements InfoContributor {@Overridepublic void contribute(Info.Builder builder) {builder.withDetail("key","value").build();}
}
复制代码

对外暴露一些程序内部的重要信息往往也是很重要排查线上问题的手段。Info适合展示不太会变动的一些复杂信息,如果希望整个历史状态信息都能保留和监控的话更适合采用下面的打点方式。

监控打点

访问/actuator/metrics可以看到下面的信息:

Spring Boot集成了一个叫做MicroMeter的库用于Metrics。这个库号称是Metrics界的SLF4J,它的作用在于:

  1. 可以适配多达10+的监控数据库,包括Graphite、Influx、StatsD等等。
  2. 以统一的语言定义了打点这个事情。
  3. 自动集成了很多JVM的信息,包括内存、GC、CPU、线程等。 我们可以随便点一个Metrics进去查看: 下面,我们来看一下如何通过简单的几个配置实现把所有的打点信息发送到InfluxDb中去。 第一步,在pom中引入influx依赖:
<dependency><groupId>io.micrometer</groupId><artifactId>micrometer-registry-influx</artifactId>
</dependency>
复制代码

当然,需要先在本机安装一下influxdb,MacOS也就是一行命令,brew install influxdb即可。 第二步,加入配置:

management.metrics.web.server.auto-time-requests=true
management.metrics.export.influx.enabled=true
management.metrics.export.influx.auto-create-db=true
management.metrics.export.influx.db=myapp
management.metrics.export.influx.step=10s
复制代码

逐一说明一下这些配置:

  1. 第一个配置用于自动开启所有Web请求的执行时间记录,如果不这么配的话可以手动在Controller上加@Timed注解
  2. 第二个配置用于开启micrometer的influx的支持
  3. 第三个配置用于自动创建influxdb的数据库
  4. 第四个配置指定了influxdb的数据库名称为myapp
  5. 第五个配置指定了汇总上报数据到influxdb的周期

我们可以启动程序,多访问几次http://localhost:8080/api/items,然后打开http://localhost:8081/actuator/metrics/http.server.requests查看,可以看到具体请求的执行次数和执行时间(证明1):

同时,我们可以在日志中看到(证明5):

2018-10-08 20:49:41.429  INFO 16390 --- [pool-1-thread-1] i.micrometer.influx.InfluxMeterRegistry  : successfully sent 73 metrics to influx
2018-10-08 20:49:51.483  INFO 16390 --- [pool-1-thread-1] i.micrometer.influx.InfluxMeterRegistry  : successfully sent 73 metrics to influx
复制代码

有73个监控指标每隔10秒发送到一次influxdb,我们可以进入influx客户端,查看这个measurement的信息(先输入命令use myapp):

还记得吗,我们实现了一个自定义的HealthIndicator,里面有用到RestTemplate来访问远程服务,现在可以尝试多访问几次http://localhost:8081/actuator/health,然后打开http://localhost:8081/actuator/metrics/http.client.requests可以看到的确有信息: 说明RestTemplat默认为我们集成了Metrics,记录客户端HTTP请求的执行情况。 数据收集和上发的工作完成了,最后我们可以brew install grafana,使用Grafna连接InfluxDb来配置一下我们的监控面板。 首先配置一下数据源: 然后就可以配置图表了: 有关Grafana的使用方式这里不详述了。

自定义监控打点

我们再来看一下如何自定义Metrics项实现自己的打点,修改一下我们的Controller:

@Autowired
MeterRegistry meterRegistry;@GetMapping("items")
public List<MyItem> items(@RequestParam(value = "count",defaultValue = "10") int count){stringRedisTemplate.opsForValue().set("testKey", "value" + count);meterRegistry.timer("mytimer").record(()-> {try {Thread.sleep(count);} catch (InterruptedException e) {}});meterRegistry.counter("mycounter").increment(count);meterRegistry.gauge("currentValue1", count);return IntStream.rangeClosed(1,count).mapToObj(i->new MyItem("name" + i,i)).collect(Collectors.toList());
}
复制代码

在这里,我们注入了MeterRegistry类,然后通过这个类我们可以方便进行各种信息的上报。在MicroMeter中,信息抽象为了这么几种:

  1. 状态信息,所谓状态信息就是每次上报的是信息的当前值,数据是不能累计的。比如当前线程数48,1分钟后是50,这个值如果进行汇总聚合的话没有太大意义(总计98个线程?平均49个线程?),在展现的时候只能展现某个时刻的某个值。
  2. 数量信息,比如请求执行的次数,一次上报可以+1也可以+N,这个数据是可以聚合的。比如如果我们在1分钟内上报了2次,一次10,一次20,那么1分钟的聚合就是总数30,每次上报记录的是聚合的总和信息。
  3. 执行时间信息,可以方便的统计方法执行时间。上报的信息会比数量信息丰富,除了次数之外还有总执行时间、平均执行时间、最长执行时间。 是不是很方便,使用MicroMeter统一的API,我们只要根据需要收集指标数据即可,剩下的数据整理、汇总以及和后端数据库交互上报数据的过程都自动完成。 最后,我们再来看一个把/actuator/health的信息转换成打点上报的例子,我们可以通过获得所有的HealthIndicator,交由CompositeHealthIndicator汇总健康信息结果,然后通过MeterRegistry上报监控信息的打点:
package me.josephzhu.spring101ops;import io.micrometer.core.instrument.MeterRegistry;
import org.springframework.boot.actuate.health.CompositeHealthIndicator;
import org.springframework.boot.actuate.health.HealthAggregator;
import org.springframework.boot.actuate.health.HealthIndicator;
import org.springframework.boot.actuate.health.Status;
import org.springframework.context.annotation.Configuration;import java.util.List;import static java.util.Collections.emptyList;@Configuration
class HealthMetricsConfiguration {private CompositeHealthIndicator compositeHealthIndicator;public HealthMetricsConfiguration(HealthAggregator healthAggregator,List<HealthIndicator> healthIndicators,MeterRegistry registry) {compositeHealthIndicator = new CompositeHealthIndicator(healthAggregator);for (Integer i = 0; i < healthIndicators.size(); i++) {compositeHealthIndicator.addHealthIndicator(i.toString(), healthIndicators.get(i));}registry.gauge("health", emptyList(), compositeHealthIndicator, health -> {Status status = health.health().getStatus();switch (status.getCode()) {case "UP":return 3;case "OUT_OF_SERVICE":return 2;case "DOWN":return 1;case "UNKNOWN":default:return 0;}});}
}
复制代码

重启应用后稍等一下,看一下InfluxDb中的数据,的确是一些值为3的记录,代表UP:

总结

本文我们通过一些例子覆盖了如下内容:

  1. Actuator模块的功能。
  2. 详述了健康检查端点,自定义健康检查项。
  3. 详述了数据信息端点,为程序添加各种附加数据项。
  4. 详述了监控打点,程序方式上报自定义的三种形式的打点。
  5. InfluxDb和Grafana的简单使用。

的确,每一个功能都是简单的几步配置,Spring Boot Actuator真的很方便,这些功能是一个真正的可用于生产环境的程序必不可少的一些功能,Spring Boot不仅仅为我们提供了方便,而且为我们定义了架构模板,让每一个开发人员都能有意识,应该做一些什么,这也就是我为什么一直说Spring引领了企业级单机开发,Spring Boot引领了互联网微服务开发。

但是,Spring Boot因为在高速发展,会不断吸收好的开源项目整合到生态中去,所以在API上变化会较多,API一直在修改,增加了不少学习成本和坑。任何事情都有两面性,我们在要求Spring生态为我们提供越来越多功能的时候,享受到便利的同时,也必须去适应Spring的快速变化。

老样子,本系列文章代码见我的github:github.com/JosephZhu19…

朱晔和你聊Spring系列S1E7:简单好用的Spring Boot Actuator相关推荐

  1. Spring 系列,第 3 部分: 进入 Spring MVC

    在 Spring 系列 的第 3 部分中,我介绍 Spring MVC 框架.就像在以前的文章中一样,我用银行示例介绍如何建模和构建简单的应用程序.示例应用程序包含了已经学过的一些技术(例如依赖注入) ...

  2. Spring系列第51篇:导致Spring事务失效常见的几种情况

    这算是spring事务第9篇文章了,花了这么多篇文章介绍事务这块的知识,说明事务这块的东西确实比较多.知识点比较细,也非常重要,希望大家能够重视起来,吃透这块的知识. 本文2个目的: 1.使用spri ...

  3. ☆聊聊Spring系列_Index

    为什么80%的码农都做不了架构师?>>>    Spring经典详解 Spring事务机制详解 Spring配置事务五种方式 关于Spring加载classpath与classpat ...

  4. 夯实Spring系列|总览介绍

    文章目录 系列文章 番外篇 1.文章说明 2.整理目的 3.Spring 核心特性 4.数据存储(Data Access) 5.Web 技术 6.技术整合 7.测试(Testing) 8.Java 版 ...

  5. 朱晔和你聊Spring系列S1E9:聊聊Spring的那些注解

    本文我们来梳理一下Spring的那些注解,如下图所示,大概从几方面列出了Spring的一些注解: 如果此图看不清楚也没事,请运行下面的代码输出所有的结果. Spring目前的趋势是使用注解结合Java ...

  6. 朱晔和你聊Spring系列S1E11:小测Spring Cloud Kubernetes @ 阿里云K8S

    有关Spring Cloud Kubernetes(以下简称SCK)详见https://github.com/spring-cloud/spring-cloud-kubernetes,在本文中我们主要 ...

  7. Spring 系列,第 2 部分: 当 Hibernate 遇上 Spring

    为什么80%的码农都做不了架构师?>>>    在这个系列的 前一期中,我介绍了 Spring 框架的 7 个模块,包括 Spring AOP 和控制反转(IOC)容器.然后我用一个 ...

  8. Spring 系列: Spring 框架简介

    Spring 是一个开源框架,是为了解决企业应用程序开发复杂性而创建的.框架的主要优势之一就是其分层架构,分层架构允许您选择使用哪一个组件,同时为 J2EE 应用程序开发提供集成的框架. 在这篇由三部 ...

  9. Spring系列之BeanPostProcessor分析

    在Spring系列之Bean的生命周期及相关源码中,我们最后简单使用过BeanPostProcessor,这次我们就结合源码来具体谈谈这个BeanPostProcessor的作用. 实现BeanPos ...

最新文章

  1. Apache多站点设定
  2. 原子微型结构信息应用到局部图形信息存储的猜想
  3. IDEA新项目代码上传到gitlab远程仓库
  4. prim算法详解java_Prim算法(三)之 Java详解
  5. U大师U盘启动盘制作工具(V1.1.0版)——升级U盘
  6. Halcon深度学习超参数
  7. fluidsim元件库下载_FluidSIM5|FluidSIM(液压气动仿真软件)下载 v5.0中文免费版 附安装教程 - 121下载站...
  8. jchdl - GSL实例 - Shifter
  9. Linux编程入门(2)-实现who指令
  10. 查看USB设备序列号的一些方法
  11. 参考文献怎么查找,去哪里查找?一篇文章讲明白这些问题
  12. Linux入门,RTFM阅读那该死的手册
  13. Sizzle选择器揭秘--Sizzle过滤器
  14. 神器必会!“世界上最好的编辑器Source Insight”
  15. 【计算机研究与发展】一种基于区块链的泛用型数据隐私保护的安全多方计算协议——CCF A
  16. 天津电子计算机职专什么时候开学,2020年开学时间表
  17. 最新软件库PHP程序源码+支持CDKey卡密充值
  18. 计算机工程与应用退修后退稿,《计算机工程与应用》退修意见 - 论文投稿 - 小木虫 - 学术 科研 互动社区...
  19. [ CTF ] WriteUp- 20221003 CTFShow新(脑洞)手(套路)杯
  20. avada functions.php,WooCommerce & Avada 主题: [已解决] 社交分享在产品类别

热门文章

  1. 深度学习--感知机讲解
  2. AI干货系列一:为什么AI预测更智能?
  3. 基于多特征地图和深度学习的实时交通场景分割
  4. Python 之 Numpy (四)索引
  5. args, sys.argv的区别
  6. 一个困扰数学家30多年的分类问题,终于被解决了!
  7. 当物联网实时工作时,城市才是“智能”的
  8. 我国机器视觉企业体量偏小,上游零部件占利润大头
  9. 20幅漫画告诉你未来世界是怎样的
  10. 新型人造DNA结构信息密度加倍