点击关注公众号,Java干货及时送达

SkyWalking 是一个应用性能监控系统,特别为微服务、云原生和基于容器(Docker, Kubernetes, Mesos)体系结构而设计。除了应用指标监控以外,它还能对分布式调用链路进行追踪。类似功能的组件还有:Zipkin、Pinpoint、CAT等。

上几张图,看看效果,然后再一步一步搭建并使用

1.  概念与架构

SkyWalking是一个开源监控平台,用于从服务和云原生基础设施收集、分析、聚合和可视化数据。SkyWalking提供了一种简单的方法来维护分布式系统的清晰视图,甚至可以跨云查看。它是一种现代APM,专门为云原生、基于容器的分布式系统设计。

SkyWalking从三个维度对应用进行监视:service(服务), service instance(实例), endpoint(端点)

服务和实例就不多说了,端点是服务中的某个路径或者说URI

SkyWalking allows users to understand the topology relationship between Services and Endpoints, to view the metrics of every Service/Service Instance/Endpoint and to set alarm rules.

SkyWalking允许用户了解服务和端点之间的拓扑关系,查看每个服务/服务实例/端点的度量,并设置警报规则。

1.1.  架构

SkyWalking逻辑上分为四个部分:Probes(探针), Platform backend(平台后端), Storage(存储), UI

这个结构就很清晰了,探针就是Agent负责采集数据并上报给服务端,服务端对数据进行处理和存储,UI负责展示

2.  下载与安装

SkyWalking有两中版本,ES版本和非ES版。如果我们决定采用ElasticSearch作为存储,那么就下载es版本。

https://skywalking.apache.org/downloads/

https://archive.apache.org/dist/skywalking/

  • agent目录将来要拷贝到各服务所在机器上用作探针

  • bin目录是服务启动脚本

  • config目录是配置文件

  • oap-libs目录是oap服务运行所需的jar包

  • webapp目录是web服务运行所需的jar包

接下来,要选择存储了,支持的存储有:

  • H2

  • ElasticSearch 6, 7

  • MySQL

  • TiDB

  • InfluxDB

作为监控系统,首先排除H2和MySQL,这里推荐InfluxDB,它本身就是时序数据库,非常适合这种场景

但是InfluxDB我不是很熟悉,所以这里先用ElasticSearch7

https://github.com/apache/skywalking/blob/master/docs/en/setup/backend/backend-storage.md

2.1.  安装ElasticSearch

https://www.elastic.co/guide/en/elasticsearch/reference/7.10/targz.html

# 启动
./bin/elasticsearch -d -p pid
# 停止
pkill -F pid

ElasticSearch7.x需要Java 11以上的版本,但是如果你设置了环境变量JAVA_HOME的话,它会用你自己的Java版本

通常,启动过程中会报以下三个错误:

[1]: max file descriptors [4096] for elasticsearch process is too low, increase to at least [65535]
[2]: max virtual memory areas vm.max_map_count [65530] is too low, increase to at least [262144]
[3]: the default discovery settings are unsuitable for production use; at least one of [discovery.seed_hosts, discovery.seed_providers, cluster.initial_master_nodes] must be configured

解决方法:

在 /etc/security/limits.conf 文件中追加以下内容:

* soft nofile 65536
* hard nofile 65536
* soft nproc  4096
* hard nproc  4096

可通过以下四个命令查看修改结果:

ulimit -Hn
ulimit -Sn
ulimit -Hu
ulimit -Su

修改 /etc/sysctl.conf 文件,追加以下内容:

vm.max_map_count=262144

修改es配置文件 elasticsearch.yml 取消注释,保留一个节点

cluster.initial_master_nodes: ["node-1"]

为了能够ip:port方式访问,还需修改网络配置

network.host: 0.0.0.0

修改完是这样的:

至此,ElasticSearch算是启动成功了

接下来,在 config/application.yml 中配置es地址即可

storage:selector: ${SW_STORAGE:elasticsearch7}elasticsearch7:clusterNodes: ${SW_STORAGE_ES_CLUSTER_NODES:192.168.100.19:9200}

2.2.  安装Agent

https://github.com/apache/skywalking/blob/v8.2.0/docs/en/setup/service-agent/java-agent/README.md

将agent目录拷贝至各服务所在的机器上

scp -r ./agent chengjs@192.168.100.12:~/

这里,我将它拷贝至各个服务目录下

plugins是探针用到各种插件,SkyWalking插件都是即插即用的,可以把optional-plugins中的插件放到plugins中

修改 agent/config/agent.config 配置文件,也可以通过命令行参数指定

主要是配置服务名称和后端服务地址

agent.service_name=${SW_AGENT_NAME:user-center}
collector.backend_service=${SW_AGENT_COLLECTOR_BACKEND_SERVICES:192.168.100.17:11800}

当然,也可以通过环境变量或系统属性的方式来设置,例如:

export SW_AGENT_COLLECTOR_BACKEND_SERVICES=127.0.0.1:11800

最后,在服务启动的时候用命令行参数 -javaagent 来指定探针

java -javaagent:/path/to/skywalking-agent/skywalking-agent.jar -jar yourApp.jar

例如:

java -javaagent:./agent/skywalking-agent.jar -Dspring.profiles.active=dev -Xms512m -Xmx1024m -jar demo-0.0.1-SNAPSHOT.jar

3.  启动服务

修改 webapp/webapp.yml 文件,更改端口号及后端服务地址

server:port: 8080collector:path: /graphqlribbon:ReadTimeout: 10000# Point to all backend's restHost:restPort, split by ,listOfServers: 127.0.0.1:12800

启动服务

bin/startup.sh

或者分别依次启动

bin/oapService.sh
bin/webappService.sh

查看logs目录下的日志文件,看是否启动成功

浏览器访问 http://127.0.0.1:8080

4. 告警

编辑 alarm-settings.yml 设置告警规则和通知

https://github.com/apache/skywalking/blob/v8.2.0/docs/en/setup/backend/backend-alarm.md

重点说下告警通知

为了使用钉钉机器人通知,接下来,新建一个项目

<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 https://maven.apache.org/xsd/maven-4.0.0.xsd"><modelVersion>4.0.0</modelVersion><parent><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-parent</artifactId><version>2.4.0</version><relativePath/> <!-- lookup parent from repository --></parent><groupId>com.wt.monitor</groupId><artifactId>skywalking-alarm</artifactId><version>1.0.0-SNAPSHOT</version><name>skywalking-alarm</name><properties><java.version>1.8</java.version></properties><dependencies><dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-web</artifactId></dependency><dependency><groupId>com.aliyun</groupId><artifactId>alibaba-dingtalk-service-sdk</artifactId><version>1.0.1</version></dependency><dependency><groupId>commons-codec</groupId><artifactId>commons-codec</artifactId><version>1.15</version></dependency><dependency><groupId>com.alibaba</groupId><artifactId>fastjson</artifactId><version>1.2.75</version></dependency><dependency><groupId>org.projectlombok</groupId><artifactId>lombok</artifactId><optional>true</optional></dependency></dependencies><build><plugins><plugin><groupId>org.springframework.boot</groupId><artifactId>spring-boot-maven-plugin</artifactId></plugin></plugins></build></project>

可选依赖(不建议引入)

<dependency <groupId>org.apache.skywalking</groupId><artifactId>server-core</artifactId><version>8.2.0</version>
</dependency>

定义告警消息实体类

package com.wt.monitor.skywalking.alarm.domain; import lombok.Data; import java.io.Serializable; /** * @author ChengJianSheng* @date 2020/12/1 */ @Data public class AlarmMessageDTO implements Serializable { private int scopeId; private String scope; /** * Target scope entity name */private String name; private String id0; private String id1; private String ruleName; /** * Alarm text message */private String alarmMessage; /** * Alarm time measured in milliseconds */private long startTime;}

发送钉钉机器人消息

package com.wt.monitor.skywalking.alarm.service; import com.dingtalk.api.DefaultDingTalkClient; import com.dingtalk.api.DingTalkClient; import com.dingtalk.api.request.OapiRobotSendRequest; import com.taobao.api.ApiException; import lombok.extern.slf4j.Slf4j; import org.apache.commons.codec.binary.Base64; import org.springframework.beans.factory.annotation.Value; import org.springframework.stereotype.Service; import javax.crypto.Mac; import javax.crypto.spec.SecretKeySpec; import java.io.UnsupportedEncodingException; import java.net.URLEncoder; import java.security.InvalidKeyException; import java.security.NoSuchAlgorithmException; /** * https://ding-doc.dingtalk.com/doc#/serverapi2/qf2nxq* @author ChengJianSheng* @data 2020/12/1 */ @Slf4j
@Service public class DingTalkAlarmService {@Value("${dingtalk.webhook}") private String webhook;@Value("${dingtalk.secret}") private String secret; public void sendMessage(String content) { try {Long timestamp = System.currentTimeMillis();String stringToSign = timestamp + "\n" + secret;Mac mac = Mac.getInstance("HmacSHA256");mac.init(new SecretKeySpec(secret.getBytes("UTF-8"), "HmacSHA256")); byte[] signData = mac.doFinal(stringToSign.getBytes("UTF-8"));String sign = URLEncoder.encode(new String(Base64.encodeBase64(signData)),"UTF-8");String serverUrl = webhook + "&timestamp=" + timestamp + "&sign=" + sign;DingTalkClient client = new DefaultDingTalkClient(serverUrl);OapiRobotSendRequest request = new OapiRobotSendRequest();request.setMsgtype("text");OapiRobotSendRequest.Text text = new OapiRobotSendRequest.Text();text.setContent(content);request.setText(text);client.execute(request);} catch (ApiException e) {e.printStackTrace();log.error(e.getMessage(), e);} catch (NoSuchAlgorithmException e) {e.printStackTrace();log.error(e.getMessage(), e);} catch (UnsupportedEncodingException e) {e.printStackTrace();log.error(e.getMessage(), e);} catch (InvalidKeyException e) {e.printStackTrace();log.error(e.getMessage(), e);}}
}

AlarmController.java

package com.wt.monitor.skywalking.alarm.controller; import com.alibaba.fastjson.JSON; import com.wt.monitor.skywalking.alarm.domain.AlarmMessageDTO; import com.wt.monitor.skywalking.alarm.service.DingTalkAlarmService; import lombok.extern.slf4j.Slf4j; import org.springframework.beans.factory.annotation.Autowired; import org.springframework.web.bind.annotation.PostMapping; import org.springframework.web.bind.annotation.RequestBody; import org.springframework.web.bind.annotation.RequestMapping; import org.springframework.web.bind.annotation.RestController; import java.text.MessageFormat; import java.util.List; /** * @author ChengJianSheng* @date 2020/12/1 */ @Slf4j
@RestController
@RequestMapping("/skywalking") public class AlarmController {@Autowired private DingTalkAlarmService dingTalkAlarmService;@PostMapping("/alarm") public void alarm(@RequestBody List<AlarmMessageDTO> alarmMessageDTOList) {log.info("收到告警信息: {}", JSON.toJSONString(alarmMessageDTOList)); if (null != alarmMessageDTOList) {alarmMessageDTOList.forEach(e->dingTalkAlarmService.sendMessage(MessageFormat.format("-----来自SkyWalking的告警-----\n【名称】: {0}\n【消息】: {1}\n", e.getName(), e.getAlarmMessage())));}}
}

5.  文档

https://skywalking.apache.org/

https://skywalking.apache.org/zh/

https://github.com/apache/skywalking/tree/v8.2.0/docs

https://archive.apache.org/dist/

https://www.elastic.co/guide/en/elasticsearch/reference/master/index.html

来源 | https://urlify.cn/Zfy2ia

热门内容:史上最强Redis6.0,世界排名第一!为什么不推荐使用BeanUtils属性转换工具
Redis分布式锁使用不当,酿成一个重大事故,超卖了100瓶飞天茅台!!!
常用正则表达式最强整理(速查手册)
最近面试BAT,整理一份面试资料《Java面试BAT通关手册》,覆盖了Java核心技术、JVM、Java并发、SSM、微服务、数据库、数据结构等等。获取方式:点“在看”,关注公众号并回复 666 领取,更多内容陆续奉上。

明天见(。・ω・。)ノ♡

用了3年CAT,这次我想选择SkyWalking,老板反手就是一个赞!相关推荐

  1. 花呗、借呗上线额度管理功能,网友:上次我没得选,这次我想做个年轻人

    Python实战社群 Java实战社群 长按识别下方二维码,按需求添加 扫码关注添加客服 进Python社群▲ 扫码关注添加客服 进Java社群▲ 作者丨花生酱 来源丨TechWeb 前不久,花呗为了 ...

  2. 996 ? 这次我想分享那些 955 的公司给你,面试的朋友看过来辣

    目录 一.前言 二.955.WLB 项目 三.955 的公司名单 四.该项目注意点 五.写在末尾 一.前言 前段时间,GitHub 惊现一个项目 996.ICU ,指的是 "工作 996, ...

  3. pdf导入ps颜色太浅_分享五个免费的pdf转换器,你更想选择哪一款?

    PDF转换器大家应该已经见过不少了,不知道大家是否知道不同转换器转换PDF文件的结果对比呢?首先我们找到了几款免费转PDF工具来看看各方的优点和缺点,这样大家选择起来就一目了然了,也可以避开一些录屏工 ...

  4. 2017 省赛选拨 想打架吗?算我一个!所有人,都过来!(3) 递推 斐波拉数列的应用...

    想打架吗?算我一个!所有人,都过来!(3) Submit Page    Summary    Time Limit: 2 Sec     Memory Limit: 128 Mb     Submi ...

  5. 要想挣大钱,就要懂一个基本

    要想挣大钱,就要懂一个基本 的理念就是必须让别人去为你挣钱, 靠自己一双手就是累死也只能糊口. 一招鲜走遍天,天下饿不死手艺人, 但也仅仅是饿不死而已.每天忙忙 碌碌的机械性重复只能挣生活费, 有时候 ...

  6. 女朋友生日java程序_★★女朋友要过生日了!我想用java为她写一个程序,一举两得啊! 希望大家多提建议啊!谢谢!!!...

    女朋友要过生日了,我想用java为她写一个程序,所以想请教大家,  希望大家给我出出点子, 同时手头有3D  等漂亮图形的java程序或其他一些特效的文字,图形java程序,都希望大家多提供,  多帮 ...

  7. 获取的字段值是空值或者为null,而你自己的需求就是想要获取的字段为一个 * 默认的值

    一.业务阐述 在开发中查询的数据库结果集,既要连接数据库.执行数据库操作.关闭数据库,还要把结果集的记录人为的设置到自己封装的DAO中等一系列的重复代码. 本文主要是想解决:用户只需要得到数据库连接, ...

  8. 程序员:妹妹高考650多,她想选择互联网专业,我该怎么劝?

    最近是高考放榜的日子,不少省份已经公布了高考学子的分数,有人欢喜有人忧,高考完后选择专业成为了众多学子面前的一道难题. 一名程序员在互联网社区求问: 妹妹高考650多,考一个985高校稳稳的,但是不知 ...

  9. .验证哥德巴赫猜想,哥德巴赫猜想的内容是:任何一个大于2的偶数都能写成写成两个素数和的形式。 设计一个函数 int isPrime(int n)判断n是否为素数,如果n是素数,函数返回值1,否则返

    .验证哥德巴赫猜想,哥德巴赫猜想的内容是:任何一个大于2的偶数都能写成写成两个素数和的形式. 设计一个函数 int isPrime(int n)判断n是否为素数,如果n是素数,函数返回值1,否则返回0 ...

最新文章

  1. TeaTalk 线上直播倒计时 | 云数据库技术创新研究与实践
  2. ISP、IAP、ICP的区别!
  3. 大型网站HTTPS实践:HTTPS对性能的影响
  4. SQLIntegrityConstraintViolationException: 异常解决
  5. vue错误:vue.esm.js?efeb:628 [Vue warn]: Error in render: “TypeError: Cannot read property ‘matched‘ of
  6. python简单爬虫入门一_Python爬虫快速入门:基本结构简单实例
  7. vSAN6.2 性能服务
  8. python网络测速_网络测速命令--speedtest
  9. 服务器被挖矿入侵,进程 command为ld-linux-x86-64占用cpu很高
  10. Kafka Broker 总体工作流程
  11. html在线表情聊天功能,HTML5高仿微信聊天、微信聊天表情|对话框|编辑器功能
  12. 谷歌浏览器扩展程序XDM_这才是谷歌浏览器的正确打开方式,有效节省内存占用,流畅飞起...
  13. 高效沟通的5个原则,解决90%的沟通问题
  14. 【车载以太网】【SOMEIP】Wireshark测试someip
  15. CentOS虚拟机根分区磁盘扩容操作
  16. oracle设置事务隔离级别为读已提交,oracle的事务隔离级别和读一致性
  17. 完美国际真数苹果_苹果被破解!iPhone也能用上安卓了
  18. 简单聊聊消息队列的事务补偿机制
  19. 微信小程序后台持续定位功能使用
  20. 线上虚拟创意展厅设计

热门文章

  1. 暑期集训2:ACM基础算法 练习题G:POJ - 1298
  2. webElement.text()获取到内容为空
  3. 数据库管理工具dbeaver
  4. react生命周期函数
  5. ehcache导致Tomcat重启出错
  6. stm32F042 (二) 按键触发中断
  7. 表情的机器自动识别(有图有真相)
  8. 【组队学习】【34期】零基础学python编程思维
  9. 资料分享:数学建模资料分享 -- 神经网络部分
  10. 【怎样写代码】函数式编程 -- Lambda表达式(四):Lambda表达式与Expression树