简介:随着微服务的流行,微服务的架构也在不断的发展演进,Spring Cloud 与 Dubbo为代表的微服务开发框架也得到了普及和落地;在云原生时代,无侵入的服务网格(Service Mesh)开始走向成熟,相对于传统微服务架构,服务网格具有可观察性、流量控制、安全性三大优势。服务网格将之前服务治理中的复杂性从应用中分离出来,将这些复杂性放到了服务代理中,包括流量控制,断路,服务发现,安全性,可观测性等;开发时应用只需要关心业务功能实现,让责任划分变得更加清楚。

1. 前言

随着微服务的流行,微服务的架构也在不断的发展演进,Spring Cloud 与 Dubbo为代表的微服务开发框架也得到了普及和落地;在云原生时代,无侵入的服务网格(Service Mesh)开始走向成熟,相对于传统微服务架构,服务网格具有可观察性、流量控制、安全性三大优势。服务网格将之前服务治理中的复杂性从应用中分离出来,将这些复杂性放到了服务代理中,包括流量控制,断路,服务发现,安全性,可观测性等;开发时应用只需要关心业务功能实现,让责任划分变得更加清楚。

阿里云服务网格是阿里云提供的全托管式服务网格平台,兼容Istio。在可观测性方面,与SLS深度集成,提供了日志采集、可视化、告警一站式可观察性解决方案。本文主要介绍介绍服务网格新推出的控制面日志采集和告警配置,同时也会涵盖数据面访问日志的采集和可视化;未来数据面的访问日志的告警也将推出更多内置告警规则,实现可以在SLS上一站式进行告警管理。

2. 阿里云服务网格(ASM)介绍

阿里云服务网格(Alibaba Cloud Service Mesh,简称ASM)提供一个全托管式的服务网格平台,兼容社区Istio开源服务网格,用于简化服务的治理,包括服务调用之间的流量路由与拆分管理、服务间通信的认证安全以及网格可观测性能力,从而极大地减轻开发与运维的工作负担。

ASM中的控制平面组件完全有阿里云托管,兼容Istio,用户只需要挂住业务应用的开发部署。 对于ACK托管集群,专有集群,Serverless集群,混合云或者多云场景,提供一致的流量控制,安全和可观测性管理,控制平面核心组件由阿里云托管,最大限度降低用户资源的开销和运维成本。

在可观测性方面,ASM支持使用SLS控制平面和数据平面的日志,并提供了内置的仪表盘及告警,未来将增加更多内置告警的内置告警规则,借助SLS强大的告警管理和通知功能,用户可以更加对ASM的运行状态更加了解,并及时获得告警通知以进行下一步操作。

3. SLS告警介绍

日志服务SLS是云原生观测与分析平台,为Log、Metric、Trace等数据提供大规模、低成本、实时的平台化服务。日志服务提供一站式数据采集、加工、查询与分析、可视化、告警、消费与投递等功能。

SLS告警是一站式的告警监控、降噪、事务管理、通知分派的智能运维平台。SLS告警的核心功能组件主包括数据存储,告警监控,告警管理,行动管理和开放告警几个子系统。

SLS告警来源主要包括自定义告警,系统内置告警和开放告警。各类告警源产生告警后,告警会发送给告警管理系统,通过告警管理系统,用户可以进行合并,抑制,静默等处理;然后告警会到通知管理系统,在通知管理中,可以设置根据不同的告警属性将将通知分派到不同的通知渠道。

4. ASM可观测性日志采集及可视化

ASM可观测性的日志主要包括控制平面和数据平面的日志:

  • 控制平面日志ASM提供了基于SLS的告警功能;
  • 数据平面日志主要包括入口网关日志,Envoy Access Log,在数据平面日志中ASM提供了基于SLS的内置仪表盘功能。

4.1. 数据平面入口网关日志采集及可视化

接入数据平面入口网关日志可以参考服务网格接入入口网关日志。主要包括安装日志服务组件和采集配置,完成采集后,在ASM控制台内嵌了入口网关概览、入口网关访问中心、入口网关监控中心三个仪表盘。

4.2. Envoy Access Log采集及可视化

接入Envoy Access Log可以参考使用日志服务采集数据平面入口网关日志,主要步骤包括安装日志服务组件和采集配置,完成采集后可以在ASM控制台查看访问日志监控中心和访问日志详细记录。

4.3. 控制平面日志采集及告警

ASM支持将控制平面的日志采集到SLS,然后根据日志进行告警配置,接下来着重介绍下如何开启控制面日志采集及告警。

4.3.1 在ASM控制台开启告警

  1. 在ASM控制台,找到关心的服务网格实例,点击进入,启用控制平面日志采集的开关,如图所示:

  1. 点击告警设置,在告警弹出框中选择行动策略,可以默认选择“SLS服务网格内置行动策略”,然后开启告警。

4.3.2 在SLS控制台配置告警通知人

  1. 在SLS控制台首页,页面上方找到日志应用,点击“告警管理中心”

  1. 点击全局配置

  1. 在左边菜单找到用户管理->用户组管理,点击右侧修改按钮,在SLS服务网关内置用户组中添加相应的联系人,即可接收告警产生后的通知。

告警管理中心是SLS下基于业务的统一智能告警运维平台,可以在全局配置->通知策略->行动策略中找到“SLS服务网关内置行动策略”,点击修改可以查看其告警通知接收人,通知模板等。

在接收到告警后,可以根据告警中的内容提示进行一些处理建议。

错误信息

处理建议

Internal:Error adding/updating listener(s) 0.0.0.0_443: Failed to load certificate chain from <inline>, only P-256 ECDSA certificates are supported

该告警信息表示数据面集群不支持您为数据面配置的证书,当前仅支持P-256 ECDSA证书。您需要重新配置证书,具体操作,请参见通过服务网关启用HTTPS安全服务

Internal:Error adding/updating listener(s) 0.0.0.0_443: Invalid path: ****

该告警信息表示您为数据面配置的证书路径有误或证书不存在,您需要检查证书挂载路径是否与Gateway中配置的路径相符。具体操作,请参见通过服务网关启用HTTPS安全服务

Internal:Error adding/updating listener(s) 0.0.0.0_xx: duplicate listener 0.0.0.0_xx found

该告警信息表示您为网关配置的监听端口重复,请检查您的Gateway,删除重复的端口。

Internal:Error adding/updating listener(s) 192.168.33.189_15021: Didn't find a registered implementation for name: '***'

该告警信息表示在Sidecar和Ingressgateway中无法找到您通过EnvoyFilter针对15021这个Listener patch的配置中引用的***,您需要删除该引用。

Internal:Error adding/updating listener(s) 0.0.0.0_80: V2 (and AUTO) xDS transport protocol versions are deprecated in grpc_service ***

该告警信息表示即将弃用您数据面的XDS V2协议,这通常是因为您的数据面Sidecar的版本与控制平面不符所致。升级数据平面的Sidecar可以解决该问题,您需要删除Pod,该Pod自动重新创建后会自动注入最新版本的Sidecar。

5. 总结

本文主要描述了如果在阿里云服务网格中开启数据面访问日志及控制面日志,并且简单介绍了数据面日志中的内置仪表盘和控制面日志的告警配置。借助SLS告警,用户可以一站式的进行告警的管理,可以有效的提供运维效率。目前SLS支持了ASM控制面日志告警,未来,在ASM数据面日志采集和可视化基础上,SLS将提供更多的内置告警规则,在ASM控制台可以实现一键开启内置告警规则,完善服务网格可观测性的闭环,用户也可以在SLS上实现统一的告警管理,敬请期待。

原文链接
本文为阿里云原创内容,未经允许不得转载。

阿里云服务网格ASM集成SLS告警相关推荐

  1. 阿里云服务网格 ASM 发布新功能:提供更精细化的服务治理能力

    简介:服务网格作为服务间通信的基础设施层,吸引了越来越多的用户使用.阿里云服务网格 ASM 将继续为开发者带来便利.9月1日,阿里云服务网格( ASM )产品经理问思为大家解读近期 ASM 发布的一些 ...

  2. 阿里云服务网格 ASM 正式发布商业化版本

    简介:为了更好地满足企业日益加深的大规模使用服务网格产品.服务多语言互通.服务精细治理等需求,2022 年 4 月 1 日起,阿里云服务网格产品 ASM 正式发布商业化版本,为企业在生产环境下大规模落 ...

  3. 【直播预告】阿里云服务网格 ASM 产品易用性改善实践与思考

    简介:为了最终共建全球事实标准,阿里云服务网格 ASM 产品选择了以开源的 Istio 为基础进行能力增强和产品化.Istio 面向微服务治理的未来做了很好的概念抽象而功能强大,也因为功能强大带来了易 ...

  4. 站酷基于服务网格ASM的生产实践

    作者:服务网格ASM 背景介绍 站酷(ZCOOL)2006 年 8 月创立于北京,深耕设计领域多年,聚集了 1500 万设计师.摄影师.插画师.艺术家.创意人,在设计创意群体中具有一定的影响力与号召力 ...

  5. 合阔智云核心生产系统切换到服务网格 ASM 的落地实践

    背景 合阔智云(http://www.hexcloud.cn) 是专注于为大中型零售连锁行业,提供全渠道业务中/前台产品和解决方案,并建立以消费者为中心的全渠道交易和敏捷供应链的新一代零售运营协同平台 ...

  6. 服务网格 ASM 年终总结:最终用户如何使用服务网格?

    01 背景 Aliware 阿里云服务网格 ASM 于 2020 年 2 月公测,近 2 年的时间,已有大量用户采用其作为生产应用的服务治理平台.阿里云服务网格 ASM 基于开源 Istio 构建.同 ...

  7. 实现全托管,腾讯云服务网格的架构演进

    导语 | 腾讯云服务网格(TCM)作为一个兼容 isito 的服务网格平台,已经在腾讯内外部有诸多落地案例.本文是对腾讯云高级工程师钟华.苗艳强在云+社区沙龙online的分享整理,深度解析服务网格架 ...

  8. 阿里云xRancher进一步强势联合,Rancher 2.3与阿里云App Hub正式集成

    2019年9月25日,开发者第一科技盛会--2019云栖大会在杭州云栖小镇拉开了帷幕,大会以数字经济为核心,聚焦前沿技术趋势,涵盖云原生.云原生数据库.5G边缘计算等技术领域.作为阿里云容器领域的紧密 ...

  9. 「云服务」阿里云服务学习路径图总结

    阿里云服务学习路径图总结 开始探索阿里云的产品和服务,可以发现无限的可能性. 云服务器 ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 ...

最新文章

  1. 闲来无事,总结 Xcode常用快捷键
  2. 教你如何反编译Android安装文件apk来偷窥源代码
  3. Flask系列06--(中间件)Flask的特殊装饰器 before_request,after_request, errorhandler
  4. android samba github,安卓手机访问树莓派samba文件共享出错解决
  5. 深入理解BodyTagSupport,包括SKIP_PAGE, EVAL_PAGE等
  6. C# 控件BackColor = Color.Transparent没有透明的原因
  7. CentOS7安装了nginx后启动本机访问不到
  8. 2009年十大Java技术解决方案
  9. 数控机床的十大数控系统,学了这么多年终于全了!
  10. houseprice_analysis_广州房子租售比分析(中)
  11. C语言商品超市管理系统课程设计,C语言课程设计超市信息管理系统.doc
  12. 金蝶BOS系统dep无法扩展,如何增加白名单使其能够继续扩展
  13. 【数据结构与算法】排序算法总结
  14. 一、Python-简介
  15. Excel 2010 SQL应用048 比较两列数据是否相同
  16. 【Vue知识点】路由router详解
  17. kaggle:Quora Insincere Questions Classification
  18. 基于F4/F7/H7飞控硬件和px4飞控固件的廉价自主无人机系统(2)- 外设和固件修改
  19. 转发文章【我们是怎样一步步的走向平庸的】
  20. 阅读---读吴军博士《态度》有感

热门文章

  1. plot函数_时间序列:python移动窗口函数前言
  2. 【LeetCode笔记】621. 任务调度器(Java、桶)
  3. python代码导出_代码生成 – Python生成Python
  4. 安卓手机如何防盗_如何设置安卓手机各版本USB调试模式
  5. python基础文档_python基本文件操作
  6. 3测试图片显示置信度_云上的移动性能测试平台
  7. java项目导入不了怎么办_Myeclipse导入项目无法部署或者丢失了.setting文件夹怎么办...
  8. 教育部:对于要求家长批改作业,发现一起严处一起
  9. 又一位!发40篇SCI,90后博士受聘985教授
  10. 复旦教授:不打不骂不罚是培养不出优秀孩子的!值得一看