近日,中国信息通信研究院分布式系统稳定性实验室正式发布了《信息系统稳定性保障能力建设指南》(以下简称《指南》)。蚂蚁集团应邀深度参与了《指南》的研讨编制,该指南收录了包括蚂蚁集团在内的多家知名机构在系统稳定性保障服务方面的优秀案例,旨在为各行业提升系统稳定性能力提供参考。

随着各领域数字化转型的推进,信息系统的应用范围不断扩大、承载业务愈发关键,用户的高频访问成为常态。面对使用需求的不断增长,大多数信息系统通过分布式架构改造、DevOps体系建设、大量引入开源技术来不断突破自身处理能力上限,这些措施引入导致了信息系统架构复杂性呈指数上升,显著增加了稳定性风险。与此同时,信息系统的稳定性也受到国家高度重视,2021年出台的《关键信息基础设施安全保护条例》,就对我国关键信息基础设施的稳定性保障工作提出了明确要求。

在此背景下,《信息系统稳定性保障能力建设指南》应运而生。作为国内首个全方位梳理总结稳定性保障相关实践经验、方法论的研究成果,指南梳理了新阶段下信息系统稳定性保障能力建设工作的相关背景、基本原则、关键要素、核心能力以及评价体系,探讨了稳定性保障工作的未来发展趋势。

《指南》认为,信息系统是各行业的基础设施,而互联网技术的高速发展为系统稳定性带来了诸多新挑战,其中分布式系统面临着更高的稳定性风险。为此,指南开创性地提出了数字化时代下的信息系统稳定性保障体系,共包含“两个总体原则、三个关键要素、四类核心能力、五项重要工作”。

不仅如此,为帮助各行业完善系统稳定性保障体系,《指南》征集收录了多个信息系统稳定性最佳实践案例,其中蚂蚁集团稳定性保障体系被收录在互联网行业案例。

蚂蚁集团主要以支付宝客户端提供支付、理财、保险等业务,服务十亿级用户,业务场景复杂度高,同时涉及金融相关业务,因此对稳定性要求极高。伴随着业务的多年发展,蚂蚁集团逐渐建立稳定性保障方面的问题解决方案和风险防控体系TRaaS(Technological Risk-defense as a Service)。TRaaS关注整个研发运维过程可能产生的稳定性风险,从流程制度、文化宣导、技术方案、平台体系多个方面提供稳定性风险防控方案,实现风险的主动发现和自我恢复能力,助力业务高质量增长。

简单来说,TRaaS 是把支付宝整个分布式架构和技术风险能力组合在一起的免疫系统,将高可用和资金安全能力结合AIOps,使系统实现故障自愈。此外,TRaaS还具备以下六大特性:

  • 统一变更管控,智能变更风险防御;
  • 基于chatops的标准SOP故障管理,精细化应急定位辅助;
  • 智能资源容量调度,实现稳定性和成本最优平衡;
  • 万亿级资金证账实智能实时核对;
  • 大规模混沌工程驱动稳定性技术演进,技术风险文化宣导;
  • AIOps在可控风险下提升运维效率;

事实上,TRaaS 诞生于蚂蚁集团超大规模系统的实战经验之中,是在经历了严酷的“双十一”等千锤百炼的考验下一步一步逐渐成长起来的技术风险防控平台,保障了内部超大规模系统的稳定性。

蚂蚁技术风险总架构李铮表示,过去十几年,因为对系统稳定和安全的重视,蚂蚁集团已经累计了无数的经验和技术。TRaaS是蚂蚁在内部大规模复杂业务中多年积累和打磨的技术风险平台能力。未来,我们将逐步开放更多技术和产品,帮助各方构建稳定的数字化系统。

目前,蚂蚁集团TRaaS技术风险防控平台正通过商业化及开源项目等形式对外输出,蚂蚁希望将自身在技术风险防控中的平台积累及实践经验分享给各行业的合作伙伴,让伙伴们能通力合作、共享风险保障技术,一起为企业系统稳定性保驾护航。

蚂蚁集团TRaaS技术风险防控平台入选中国信通院《信息系统稳定性保障能力建设指南(1.0)》最佳实践案例相关推荐

  1. 独家 | 蚂蚁金服TRaaS技术风险防控平台解密

    小蚂蚁说: 在金融行业,风险防控能力的重要性不言而喻.而蚂蚁金服可实现高达99.999%的异地多活容灾,千亿级资金秒级实时核对"账.证.实"等能力也让业界有目共睹. 今年位于杭州的 ...

  2. 蚂蚁金服 TRaaS 技术风险防控平台解密

    在金融行业,风险防控能力的重要性不言而喻.而蚂蚁金服可实现高达 99.999% 的异地多活容灾,千亿级资金秒级实时核对"账.证.实"等能力也让业界有目共睹. 今年位于杭州的蚂蚁金服 ...

  3. 技术风险防控平台:打造金融交易系统的故障免疫能力

    摘要:以"数字金融新原力(The New Force of Digital Finance)"为主题,蚂蚁金服ATEC城市峰会于2019年1月4日上海如期举办.分论坛上,蚂蚁金服高 ...

  4. 博睿数据一体化智能可观测平台入选中国信通院2022年“云原生产品名录”

    近日,中国信通院正式发布了2022年度"云原生产品名录",博睿数据发布的一体化智能可观测平台ONE凭借智能的见解和卓越的体验,同时入选了中间件服务和其他服务两类产品名录. 近年来, ...

  5. 字节跳动联邦学习平台通过中国信通院首批评估 数据安全能力得到专业验证

    近日,中国信息通信研究院(以下简称"中国信通院")公布了安全评估结果,字节跳动Fedlearner联邦学习平台(以下简称"字节跳动Fedlearner")成为顺 ...

  6. 红蓝对抗常态化 支付宝技术风险防控机制首次曝光

    小蚂蚁说: 支付宝红蓝CP又开始日常"互怼"啦!为了迎接年度技术"期末考试"周,技术蓝军每周都会组织突袭攻击"测验",通过实战中发掘出来的脆 ...

  7. 银行智能风险防控系统(第二版)

    需求工程5组第一阶段需求文档 目录 1.引言... 1 1.1项目目的.... 1 1.2项目范围.... 2 1.3 项目概览.... 3 2.项目总体描述... 3 2.1产品前景.... 3 2 ...

  8. 银行智能风险防控系统(第一版)

    需求工程5组第一阶段需求文档 目录 1.引言... 1 1.1项目目的.... 1 1.2项目范围.... 2 1.3 项目概览.... 3 2.项目总体描述... 3 2.1产品前景.... 3 2 ...

  9. 天冕数据开发平台通过信通院“大数据产品能力评测”

    近日, "大数据产品能力评测"评审会圆满结束. 评审会专家由来自中国信息通信研究院(以下简称"中国信通院").北京航空航天大学.中央财经大学.北京邮电大学.北京 ...

最新文章

  1. CSS3 (animation)
  2. 一脸懵逼学习Hadoop中的序列化机制——流量求和统计MapReduce的程序开发案例——流量求和统计排序...
  3. ALGO-22_蓝桥杯_算法训练_数的划分(DP)
  4. c语言中变量的值十进制,C语言中介绍的整型变量 即十进制 十六进制什么的是什么意思 能具体解释一下吗 还有换算什么的 谢谢...
  5. LaTeX:equation, aligned 书写公式换行,顶部对齐
  6. pytorch学习笔记(三十八):Image-Augmentation
  7. linux克隆后没有eth0,解决linux机器克隆后eth0不见的问题
  8. Excel表格实现下拉复选框多选
  9. 微观交通仿真软件分析比较
  10. mysql解锁_mysql锁表如何解锁
  11. ES 关于text和keyword两种类型数据搜索区别
  12. 判断一个数能否同时被3和5整除
  13. MTK 6737 Flash配置
  14. Front Immunol 复现 | 1. GEO数据下载及sva批次校正(PCA可视化)
  15. Subset sum problem
  16. Sharepreferences
  17. 李宏毅2021/2022春机器学习课程(机器学习基本概念简介)
  18. clamav的病毒库文件的文件头的信息说明(clamav版本号等)
  19. 新型和增强的Guardium离群值检测
  20. 如何获得最佳学习效果?

热门文章

  1. android电视分辨率是多少合适,电视分辨率多少合适
  2. 跨境电商须知:Google CWV新政及应对之道(下)
  3. python中pass的含义_python中pass语句意义与作用(实例分析)
  4. 粗浅地浏览一下,待明日来嘞,认真去刷!
  5. Thinkphp5关联模型的定义与使用
  6. AlphaFold2预测蛋白、肽结构网站简易版教程
  7. html中的城市代码大全,html代码大全
  8. antdprotable defaultExpandAllRows巨坑的坑
  9. python输入正方形边长值、计算其面积_尝试修改列6.2编写命令行参数解析的程序,解析命令行参数所输入边长的值,计算并输出正方形的周长和面积。_学小易找答案...
  10. SubString SAM+LCT