微服务追踪系统,你绝对想不到!
前言
在微服务架构中,一次请求往往涉及到多个模块,多个中间件,多台机器的相互协作才能完成。这一系列调用请求中,有些是串行的,有些是并行的,那么如何确定这个请求背后调用了哪些服务,哪些模块,哪些节点及调用的先后顺序?如何定位每个模块的性能问题?本文将为你揭晓答案。
微服务架构
这是一个稍微复杂的例子
如果有用户反馈某个页面很慢,我们知道这个页面的请求调用链是 A -----> C -----> B -----> D,此时如何定位可能是哪个模块引起的问题呢?
更进一步,如果每个服务 Service A,B,C,D 都部署在好几台机器上。怎么知道某个请求调用了服务的具体哪台机器呢?
可以明显看到,由于无法准确定位每个请求经过的确切路径,在微服务这种架构下有以下几个痛点:
1. 排查问题难度大,周期长
2. 特定场景难复现
3.系统性能瓶颈分析较难
有没有一种办法可以准确地产生完整的调用链,并且用可视化的方式呈现出来呢?
这就需要一个分布式调用链追踪系统。
分布式调用链追踪系统:设计
想想看,如果要我们自己实现一个这样的分布式追踪系统,该怎么去设计?
首先,我们必须得区分每个调用链(起个时髦的名称叫 Trace),得给它分配一个全局唯一的 ID (称为 TraceID),并且在调用链上的每次调用都带上这个 ID,这样每个子调用都被关联起来了。
其次,我们得记录所有调用的先后次序和父子关系。
假设有以上这样的调用链,如果我们只记录了这四个调用:
A---->B
B---->C
A---->D
D---->E
D---->F
虽然我们知道它属于一个调用(TraceID 相同),还是无法画出完整的调用拓扑图。
所以必须得记录父子关系:
A---->B 是 B---->C 的父调用
A---->D 是 D---->E 的父调用
A---->D 还是 D---->F 的父调用
如何记录呢?需要给每个调用分配一个ID (称为 SpanID),并且把这个 ID 传递给子调用, 子调用根据 Parent Span ID 生成自己的 SpanID:
用表格展示是这样:
这样根据 id 间的关系就很容易据此画出调用链了(即可视化视图)
魔法师Agent
前面说得挺容易,但是在分布式的环境下,如何才能正确地生成 TraceID, ParentSpanID, SpanID 呢?
微服务是来实现业务的,肯定不能来干这个监控和跟踪的活儿,那样对微服务的侵入性就太强了。
所以必须得有一个独立的组件,在不干扰微服务的情况下,监控微服务之间的调用,把这些 ID 生成, 这个独立的组件就是 Agent。
Agent 要想施展魔法,需要安装在每个服务所在的机器上:
这个魔法师遵循的规则也非常简单,以上图中服务 A 上的 Agent 为例:
1. 当 Agent 监控到有人在调用服务 A,但是没有 ParentSpanID, 它就知道,这是一次全新的调用,应该创建新的 TraceID。
2. 当Agent监控到 A 调用了 B 时, 它就可以生成 SpanID = 1,并且把这个 ID 当作 ParentSpanID 传递给 B。这样当 B 调用 C 的时候, B 的 Agent 就能生成此次调用的 SpanID 为 1.1
3. 当 Agent 监控到 A 调用 D 的时候,可以生成 SpanID = 2, 并且把这个 ID 当作 ParentSpanID 传递给 D
D 在调用 E 和 F 的时候,就能分别生成 SpanID 2.1 和 2.2
你也许注意到了一个问题:微服务都是跨进程调用的,怎么可能把 TraceID , ParentSpanID 在服务之间传来传去呢?
这就需要 Agent 来施展“魔法”了,Agent 需要理解微服务之间的传输协议,然后把 TraceID,ParentSpanID 悄悄地“藏”到某个地方,传递给下一个服务。
例如 HTTP 协议中定义了 Header 与 Body,Header 一般放请求的长度,请求 IP等非业务的信息。业务数据一般放在 Body 中。于是 Agent 就可以把 TraceID,ParentSpanID 悄悄地“藏到” Header 中,这样既不会对 Body 中的业务数据造成影响,又可以把跟踪所需的数据传递给下一个服务了。
你的脑海中可能已经想到 Agent 的实现原理了,这个 Agent 可以这么来实现:
指定微服务中的“RPC 调用的公用程序”(例如 Dubbo 中的 MonitorFilter.invoke方法), 然后在运行时,通过动态修改字节码的方式来增强它:
当服务 A 调用服务 B 时, Agent 就可以做点儿手脚,修改 header 了:
数据收集
Agent 虽然监控、生成了足够多的数据,但是单个 Agent 无法获得全局视图,我们需要一个全局的收集器来把 Agent 的数据收集上来,这样才能生成全局的调用链。
数据收集器获得了全局的数据以后,就可以画出漂亮的调用链的图了,例如这个:
小结
经过一番探索,一个分布式调用链系统的核心组件和实现原理浮出水面,当然,其中还有很多细节需要处理,例如采样的频率,全局唯一 ID 的生成算法,UI界面等等。市面上有不少开源的分布式跟踪系统,如 SkyWalking、Zipkin、Pinpoint 等等,感兴趣的可以继续深入研究。
特别推荐一个分享架构+算法的优质内容,还没关注的小伙伴,可以长按关注一下:
长按订阅更多精彩▼如有收获,点个在看,诚挚感谢
微服务追踪系统,你绝对想不到!相关推荐
- 一个微服务业务系统的中台构建之路
一个微服务业务系统的中台构建之路 中台是近两年软件开发领域的热点话题,相关的文章也成为了各个技术社区和媒体争相报道的网红内容.作为企业支撑业务开发的核心系统,中台的重要性不言而喻,很多企业也开始尝试中 ...
- springcloud 整合 gateway_GitHub上最火的SpringCloud微服务商城系统项目,附全套教程
项目介绍 mall-swarm是一套微服务商城系统,采用了 Spring Cloud Greenwich.Spring Boot 2.MyBatis.Docker.Elasticsearch等核心技术 ...
- .NET Core微服务 权限系统+工作流(二)工作流系统
一.前言 接上一篇 .NET Core微服务 权限系统+工作流(一)权限系统 ,再来一发 工作流,我在接触这块开发的时候一直好奇它的实现方式,翻看各种工作流引擎代码,探究其实现方式,个人总结出来一个核 ...
- mall-swarm是一套微服务商城系统
介绍: mall-swarm是一套微服务商城系统,采用了 Spring Cloud Hoxton & Alibaba.Spring Boot 2.3.Oauth2.MyBatis.Elasti ...
- 获取网关_阿里二面问了这道题:如何设计一个微服务网关系统
有一天隔壁组的小王灰头土脸的跑过来,问我说:"李哥,你会设计微服务网关系统吗?".我一愣,小王怎么突然问这么抽象的问题,关键是我们最近也没有这样的需求.吃午饭的时候,在我旁敲侧击的 ...
- 对微服务监控系统分层和监控架构的理解
对微服务监控系统分层和监控架构的理解 目录 微服务专栏地址 目录 1. 简介 2. 为什么需要监控体系 3. 与单体应用有什么区别 4. 要监控什么 5. 监控体系和分层 6. 监控架构和主流技术栈 ...
- mall-swarm微服务商城系统
mall-swarm是一套微服务商城系统,采用了 Spring Cloud 2021 & Alibaba.Spring Boot 2.7.Oauth2.MyBatis.Docker.Elast ...
- JAVA计算机毕业设计鲜花订购网微服务Mybatis+系统+数据库+调试部署
JAVA计算机毕业设计鲜花订购网微服务Mybatis+系统+数据库+调试部署 JAVA计算机毕业设计鲜花订购网微服务Mybatis+系统+数据库+调试部署 本源码技术栈: 项目架构:B/S架构 开发语 ...
- 微服务追踪SQL(支持Isto管控下的gorm查询追踪)
效果图 SQL的追踪正确插入到微服务的调用链之间 详细记录了SQL的执行内容和消耗时间 搜索SQL的类型 多线程(goroutine)下的追踪效果 在 Kubernetes 中部署微服务后,通过 Is ...
最新文章
- 线程中应该注意的问题
- 修改注释里的作者名字
- 无法实现接口成员,因为它不是公共的——interface
- Spring-Aop-注解实现
- ES6/02/创建对象,构造函数和原型,原型和原型链,this指向,类,ES5新增的方法,数组方法,回调函数,ES5新增的字符串方法,ES5中新增的对象方法
- 动手学深度学习Pytorch Task01
- 微信抖音快手壁纸小程序三合一源码+后端功能丰富
- Bryntum Web JavaScript Components Crack
- 域名whois查询接口代码
- 解读群体机器人合力协作精神
- Kanban in Action 免积分下载
- python画venn图
- 记录某学校热水卡安全性研究
- 刘泽云《计量经济学实验教程》笔记
- Excel如何设置下拉选项,并应用到整列
- 第 2-3 课:迭代法计算定积分
- 如何打破校园网垄断现象?
- 垃圾邮件过滤优化方法
- FileNotFoundException open failed: XXXXXXX EPERM (Operation not permitted)的坑
- 《大话设计模式》精髓理解——Chapter 01 - 05 开放封闭与依赖倒转
热门文章
- 简单介绍一下umask 命令使用方法
- 简单介绍Git合并分支的流程步骤
- C++中的大小转换函数和翻转函数
- 数论基础--矩阵快速幂 及其例题
- 组合计数 ---- Codeforces 737C Div2 C. Moamen and XOR [多阶段决策计数dp]
- 组合计数 ---- 732 Div2 D. AquaMoon and Chess
- Educational Codeforces Round 84 (Rated for Div. 2) A~ ESZU cf集训
- 【牛客挑战赛】我是 A 题
- java设置可信任站点_通过网页修改activex安全设置,添加信任站点,禁用弹出窗口阻止程序...
- pycharm新建django模板!DOCTYPE html划红线