7月27日,2021可信云大会在北京召开。会上,阿里云故障演练平台入选可信云最佳技术实践,并首批通过可信云混沌工程平台能力要求最高等级-先进级认证。同时,由信通院牵头,阿里云计算有限公司联合多家企业共同发起的“混沌工程实验室”宣布成立。

双项认证,阿里云故障演练平台获可信云最高等级认证

随着企业对于云计算的理解和实践不断深入,基于云计算的分布式架构成为越来越多企业应用构建的首选方案,如何通过混沌工程提升云原生系统稳定性和保障业务连续性成为业内普遍关注的话题。

混沌工程是主要通过故障注入的方式,提前发现系统稳定性等问题,旨在提升系统和组织韧性,打造韧性的架构,保障业务连续性。在信通院可信云混沌工程平台测评中,阿里云故障演练平台以最高分成绩通过资源支持、故障场景、场景管理、实验流程、实验防护、实验度量、权限管理、安全审计等8项能力测评,并入选2021可信云最佳技术实践,双项认证,再一次证明了阿里云在混沌工程领域的技术和产品实力。

故障演练随着阿里巴巴系统架构从微服务,到容器化,再到云原生一起发展,内部已有近10年的混沌工程落地实践经验。阿里云故障演练平台将阿里巴巴内部的实践经验以产品化的方式对外输出,提供丰富的实验场景和专家经验库、领域化的解决方案,满足用户的故障场景需求,在灵活的流程编排和开放的集成能力下,提供监控、报告等实现混沌工程实施闭环,通过权限管控和演练防护来控制故障演练的风险,帮助企业在云迁移、云就绪、云原生过程中提升系统稳定性和业务连续性。

自混沌工程理论提出以来,很多企业在探索和实践,但落地形式不同,阿里云故障演练平台有何不同?

  • 灵活的流程编排:制订了一套标准化的演练流程,在此基础上可以添加所需的流程节点。同时支持多场景的运行方式。
  • 可视化故障演练:与架构感知集成,在架构拓扑可视化的基础上,实现故障注入,同时可以配合架构巡检,发现系统风险点,使用故障演练进行验证。
  • 多样的专家经验库:将阿里巴巴内部多年的故障演练经验沉淀到演练模板中,具备演练场景的真实性和实用性,极大的提升演练创建的效率,同时解决用户上手混沌工程难的问题。
  • 领域化的解决方案:提供对服务组件、系统架构等稳定性验证的产品化解决方案,通过架构感知、依赖分析等动态识别组件和架构,自动生成演练方案,达到快、准、全的演练目的。

使用故障演练平台做混沌工程,可以衡量微服务的容错能力,估算系统容错红线,衡量系统容错能力。并且,故障演练平台可以验证容器编排配置是否合理,测试PaaS层是否健壮,验证监控告警的时效性,提升监控告警的准确和时效性。通过故障突袭,随机对系统注入故障,考察相关人员对问题的应急能力,以及问题上报、处理流程是否合理,达到以战养战,锻炼人定位与解决问题的能力。通过故障注入的方式,提前发现系统稳定性等问题,旨在提升系统和组织韧性,打造韧性的架构,保障业务连续性。

阿里云故障演练平台自2019年商业化以来,通过多样化的实验工具,自动化的工具部署,多维度的演练方式,灵活的流程编排,丰富的故障场景,实用的演练模板,专业的解决方案,安全的演练防护,深度的云产品集成,已经拥有近千个企业客户,服务了包括华泰证券、比心科技、亲宝宝等客户,助力企业在云原生时代构建数字韧性能力。

推动标准统一,打造ChaosBlade 开源项目,缩短构建混沌工程路径

近几年,越来越多的企业开始关注并探索混沌工程,渐渐成为测试系统高可用,构建对系统信息不可缺少的工具。但混沌工程领域目前还处于一个快速演进的阶段,最佳实践和工具框架没有统一标准。实施混沌工程可能会带来一些潜在的业务风险,经验和工具的缺失也将进一步阻止 DevOps 人员实施混沌工程。混沌工程领域目前也有很多优秀的开源工具,分别覆盖某个领域,但这些工具的使用方式千差万别,其中有些工具上手难度大,学习成本高,混沌实验能力单一,使很多人对混沌工程领域望而却步。

阿里巴巴集团在混沌工程领域已经实践多年,为了帮助企业更好地构建混沌工程路径,阿里巴巴在2019年开源了混沌工程项目 ChaosBlade,并在今年成为 CNCF Sandbox 项目。将"自研技术"、“开源项目”、"商业产品"形成统一的技术体系,阿里云通过三位一体的正向循环,实现了技术价值的最大化。

ChaosBlade 是一款遵循混沌工程原理的开源工具,包含混沌工程实验工具 chaosblade 和混沌工程平台 chaosblade-box,旨在通过混沌工程帮助企业解决云原生过程中高可用问题。实验工具 chaosblade 支持 3 大系统平台,4 种编程语言应用,共涉及 200 多个实验场景,3000 多个实验参数,可以精细化地控制实验范围。ChaosBlade 已成为阿里云故障演练平台基础能力底座服务众多企业客户。

未来,ChaosBlade 将继续以云原生为基础,提供面向多集群、多环境、多语言的混沌工程平台和混沌工程实验工具;后续会托管更多的混沌实验工具和兼容主流的平台,实现场景推荐,提供业务、系统监控集成,输出实验报告,在易用的基础上完成混沌工程操作闭环。

业内首个混沌工程实验室正式成立,推动混沌工程实践落地

在数字化产业对系统稳定性和云计算高可用要求越来越高的大背景下,由中国信通院牵头,阿里云等众多企业共同参与的混沌工程实验室正式成立。混沌工程实验室将推动混沌工程在各领域典型应用场景中的实践落地,联动云计算上下游企业来共同推进混沌工程快速发展。

阿里云拥有国内最丰富的混沌工程实践经验,并致力于打造云原生时代的混沌工程标准体系。阿里云在海量互联网服务以及历年双11场景的实践过程中,沉淀出了包括全链路压测、线上流量管控、故障演练等高可用核心技术,并通过开源和云上服务的形式对外输出,以帮助企业用户和开发者享受技术红利,提高开发效率,缩短业务的构建流程。

阿里云故障演练平台获得可信云最高等级认证,为企业数字韧性能力保驾护航相关推荐

  1. 博云容器云、DevOps 平台斩获可信云“技术最佳实践奖”

    7 月 21 日,2022 可信云大会在北京顺利开幕,会上中国信通院颁布了可信云最佳实践评选结果.博云容器云和博云牧繁 DevOps 平台成功入选可信云技术最佳实践云原生-容器及管理.可信云最佳实践软 ...

  2. 阿里云ET工业大脑获“可信云”工业智能云奖

    本文讲的是阿里云ET工业大脑获"可信云"工业智能云奖[IT168 云计算]7月26日消息,在"2017可信云大会"上,阿里云斩获唯一的工业智能云奖.阿里云是亚洲 ...

  3. 为云服务立规矩——首批可信云服务认证名单公布

    俗话说,没有规矩不成方圆.在云服务蓬勃发展的今天,无论从规范行业发展,还是为用户提供保障,推动政府云服务采购的角度来说,云服务市场都需要立规矩. 7月15日至16日,以"可信中国云,未来新生 ...

  4. 阿里云智能接入网关SAG通过可信云SD-WAN方案认证

    在2020中国可信云大会上,阿里云智能接入网关SAG凭借独特的云原生的SDWAN理念和业界领先的智能.可靠.安全性设计,通过可信云SD-WAN解决方案(服务型)认证,成为国内率先通过可信云SD-WAN ...

  5. 阿里云云效荣获首个可信云DevOps解决方案国家级标准先进级认证

    2020年9月18日,云栖大会"云效,开启新一代企业级DevOps时代"论坛在云中举行,论坛邀请到中国信息通信研究院云大所云计算部副主任陈屹力.广东农信银信中心技术总监赵瑜.人力家 ...

  6. 【STM32+ESP-12S连接腾讯云物联网开发平台 1】云平台的创建和AT固件烧录

    腾讯云物联网开发平台创建和ESP-12S的固件烧录 前言 一.腾讯云物联网开发平台的创建 1. 创建产品 2. 配置产品和创建设备 3. 设备三元组说明 二.ESP-12S固件烧录 1.固件获取 2. ...

  7. 安全可信 | 首批+先进!天翼全栈混合云一举斩获三项可信云评估

    2022年底,由中国信息通信研究院主办的"2022混合云技术发展论坛"在北京召开,论坛上发布了多项团体和行业标准,受到了产.学.研各方的关注. 天翼云率先顺利通过<混合云超融 ...

  8. 视频融合云服务EasyCVR平台部署在云服务器中的配置关键点

    AI智能安防视频平台EasyCVR视频融合云服务支持分发RTSP.RTMP.FLV.HLS.WebRTC等多种格式的视频流,可灵活运用于多场景需求中,可覆盖全平台(Linux.Windows.Andr ...

  9. 阿里云AHAS Chaos:应用及业务高可用提升工具平台之故障演练

    简介: 阿里云AHAS Chaos:应用及业务高可用提升工具平台之故障演练 应用高可用服务AHAS及故障演练AHAS Chaos 应用高可用服务(Application High Availabili ...

最新文章

  1. 【康奈尔大学】机器学习领域读博这段旅程的一些感悟
  2. python逗号bug
  3. linux 常用命令 杂记
  4. 网页常用动态效果--悬浮广告
  5. mino文件服务器删除文件,Spring-minio
  6. linux 进入rescue模式,一个简单小例子来说一下Rescue营救模式
  7. Windows 搭建 FTP 服务器
  8. 网络爬虫-学习记录(三)使用Selenium并对去哪儿网站进行爬取
  9. rss对称网卡linux,dpdk-18.11网卡多队列RSS设置
  10. 美术 2.4 UV原理基础
  11. excel概率密度函数公式_使用Excel绘制t分布概率密度函数
  12. html网页无刷新数据更新,使用javascript怎么实现页面无刷新更新数据
  13. 《数据结构与算法》课程设计:18-背包问题
  14. vue中eslint报错的解决方案
  15. 《数据结构、算法与应用 —— C++语言描述》学习笔记 — 优先级队列 — 左高树
  16. EAST的EPTC骗局
  17. 识别二维码、并保存二维码链接至csv文件
  18. IDEA中三种快速实现接口的快捷键
  19. 为什么蓝鸽的听力下载完还是听不了_首考如何拿到雅思听力8.5?
  20. 使用React Native编写的一款阅读类app ———《轻松一刻》

热门文章

  1. 【网络安全】Penelope:一款功能强大的Shell处理工具
  2. grafana—— worldPing APP 中文
  3. 1.17 项目实例:模仿斗地主洗牌发牌小游戏
  4. Acwing第 24 场周赛【完结】
  5. Dubbo监控中心Windows安装
  6. Thymeleaf页面级联属性
  7. python tkinter button颜色变不了_更改函数中Tkinter按钮的颜色
  8. springboot多数据源配置_SpringBoot-配置多数据源
  9. 强烈推荐:Spring 核心知识点总结.pdf
  10. HTTP Status 500 - Servlet.init() for servlet springmvc threw exception