简介:在今年的天猫双 11 中,中间件支撑了 5403 亿的交易量,并全面升级到了公共云架构。 此次的架构升级,是以开源为内核、以公共云为基础、以 OpenAPI 进行解偶扩展,在架构上,对开源、自研、商业化进行统一。通过采用和反哺开源、推动社区建设,通过阿里巴巴丰富的业务场景、打磨技术的性能和可用性,通过云上商业化服务更多企业、打造更好的用户体验,全方位锤炼云上产品的竞争力。

作者 | 中间件支持集团上云技术小组

2019 年,阿里巴巴核心系统 100% 运行在阿里云上。2021年,阿里巴巴业务 100% 云原生化。阿里巴巴已经成为全球首家,将所有业务都放在自家公共云上的大型科技公司。

举全集团之力,将业务全部迁移至公共云,不仅是对云的笃定,也证明了阿里云有能力应对高难度、超复杂环境下的技术挑战,为客户享受云上技术红利提供了更坚实的实践保障。

01 架构一致性,开源、自研、商业化三位一体

在今年的天猫双 11 中,中间件支撑了 5403 亿的交易量,并全面升级到了公共云架构。

此次的架构升级,是以开源为内核、以公共云为基础、以 OpenAPI 进行解偶扩展,在架构上,对开源、自研、商业化进行统一。通过采用和反哺开源、推动社区建设,通过阿里巴巴丰富的业务场景、打磨技术的性能和可用性,通过云上商业化服务更多企业、打造更好的用户体验,全方位锤炼云上产品的竞争力。

这个过程中,阿里巴巴业务的研发效率提升了 20%,CPU 资源利用率提升了 30%,应用 100%云原生化,在线业务容器可达百万规模,计算效率大幅提升,双 11 计算成本下降 30%。

接下去,我们将全方位揭秘业务 100%云化过程中,后端 BaaS 化,运行时 Mesh 化,业务侧 Serverless 化的全过程。

02 中间件后端 BaaS 化,有状态应用也可分钟级交付

以往的双 11 建站交付都是线性的。先交付 IaaS 资源,然后再交付中间件,最后再交付业务。

今年,中间件升级到公共云架构后,IaaS 资源和中间件同步交付,节省了两者串行交付的时间。中间件公共云架构运维底座全部切到 K8s 上,让有状态的中间件也能做到极致弹性,使得中间件的交付效率从天级别,降低到了分钟级,极大地提升了交付效率,降低了资源保有时间和资源成本。

后端的支撑系统也全面升级,如通过对接阿里云账号权限体系,来解决安全问题;通过对接计量计费体系,来解决 IT 资产数字化问题,为集团各个技术团队的经营者可以通过账单形式,可视化的进行成本优化。

在用户界面上,也升级支持了 IPv6,为阿里巴巴生产网全面向 IPv6 架构演进做好了准备。

03 海外业务 Mesh 化,异地多活可下沉 Sidecar

阿里巴巴海外有 AE&Lazada 等多种业务形态,异地多活体系侵入性大,技术架构不统一,从而影响了全局高可用和研发协同效率。

随着服务网格架构的演进和成熟,我们逐步将服务路由标准化,路由功能层次化,通过插件模式让业务进行扩展,让异地多活体系下沉到 Sidecar,和业务逻辑解偶,探索异地多活通用、无侵入、低成本的解决方案。今年,这套体系在海外业务得到了充分验证,为未来商业化积累了实践经验。

随着 Mesh 化服务架构的深度应用,除了异地多活功能下沉 Sidecar,阿里巴巴还基于 Mesh 化架构,统一了流量调度技术与产品架构,降低了流量调度实施和治理成本,提升服务容灾能力和线上服务治理效率,实现了更加灵活和稳定的调度规则下发及单元间切流。

04 业务侧 Serverless 化,实现研发提效 38%,弹性提升 200%

Serverless 是阿里巴巴降本提效的首选技术方案。

今年双 11,Serverless 不仅成功承载了 3 倍的峰值流量 ,支撑应用场景数量也提升了 2 倍,整体研发运维体系提升 38%,主要表现在以下两个关键点上。

1、夯实三位一体技术体系,使用阿里云函数计算 FC 支撑大促全面 Serverless 化

函数计算 FC 与阿里内部的运维体系,实现全面标准化对接,打通研发的最后一公里。首次实现了业务全链路“ FaaS + BaaS ”的 Serverless 全流程研发体系。

在函数计算进入集团之前,云上的 Serverless 技术体系一直无法融入到开发者生态,虽然功能丰富、强大,但是无法被业务使用,甚至出现了使用 Serverless 技术后,研发成本反而增高的情况。所以,在 2021 年,我们发力 Serverless-Devs 工具链,基于标准的接口与集团内部的技术社区,共同打造了专属于 Serverless 的研发体系,把云上的技术巧妙的融入到了集团。

通过双 11 大促场景作为“磨刀石”,把关键的核心技术进行进一步打磨,然后反哺给云上的商业化产品和工具链,夯实三位一体的技术体系,今年交出了满意的答卷,全面支撑 2021 天猫 双 11 各类业务场景,覆盖淘特、淘系、阿里妈妈、1688、高德和飞猪等多类业务场景,数量提升 2 倍,峰值流量总数同比增加 3 倍,实现了 50w QPS 的突破,整体研发提效达到 38%。

2、加大 Serverless 硬核技术投入,阿里内部通过天猫双 11 场景打磨,外部通过公共云输出、服务千万家企业

在 Serverless 的场景下,冷启动的速度是客户选型的关键,也是云上产品的核心竞争力,。

今年,我们加大了硬核技术研发的投入,从“弹性策略”、“镜像分发”、“容器启动” 等全方位对冷启动进行了性能提升,冷启动时间进一步缩减 60%,刚性交付能力提升 200%。在年初,函数计算刚应用于集团内部时,Runtime 层的冷启动时间在秒级别,并且需要初始化中间件,整体的冷启动时间要大于 2s,这严重制约了 Serverless 的使用场景。

所以,我们在镜像分发上,创新性发明了 Serverless Caching 。根据不同的存储服务特点,构建数据驱动、智能高效的缓存体系,实现软硬件协同优化;即便在 GB 级别镜像冷启动的场景下,函数计算也能提秒级别的交付能力。

在调度上,相比去年,增加了定时/CPU 等更多指标的弹性策略,并且基于集团内资源统一调度的能力,支撑了天猫双 11 业务的 10w 级别的实例弹性。在容器层,使用了自研的安全容器池化技术,在容器启动上,时间进一步缩小到 50ms 以内。

这些技术,都已经在双 11 场景下得到验证,也在公共云上全面输出,已经帮助我们的合作伙伴轻松应对业务高峰。

05 从 Ops 到 Dev,云原生的技术改造正进入下半场

第一时间让客户使用跟阿里巴巴一样的技术,是中间件开源、自研、商业化三位一体的初衷。这些源自三位一体的产品正帮助云上客户更好的提升 Ops 的效率。

三位一体的商业化输出包括:

  • 微服务引擎 MSE:注册&配置中心全(原生支持 Nacos/ZooKeeper/Eureka)、网关(原生支持 Ingress/Envoy)和无侵入的开源增强服务治理(原生支持 Spring Cloud/Dubbo);
  • 消息队列 MQ:原生支持 Apache RocketMQ、Apache Kafka;
  • 应用实时监控服务 ARMS:原生支持 Prometheus,提供基于开源的 Tracing 能力;
  • 应用高可用服务 AHAS:原生支持 Sentinel、ChaosBlade;
  • 函数计算 FC:支持开发者工具开源 Serverless Devs、开源可观测工具等。

云计算和云原生技术上半场更多的是解决的是 Ops 的问题,我们相信下半场更多是关注 Dev 的问题。

围绕着开发者效率的提升,中间件已经完成了 Serverless、应用运行时、低代码、云边一体,在线 IDE 等关键领域的技术布局,通过服务网格和应用运行时等技术,将非业务逻辑下沉,并且通过插件模式,形成新的研发分工,让中间件研发屏蔽底层复杂技术,让安全研发在应用运行时这层建立可信的安全防线,让高可用研发在底层通用的构建熔断、限流、降级、异地多活等能力,让业务更轻量,更聚焦业务本身开发,更高效的构建业务竞争力。

原文链接
本文为阿里云原创内容,未经允许不得转载。

我们如何实现“业务 100% 云原生化,让阿里中间件全面升级到公共云架构”?相关推荐

  1. 在阿里,我们这样帮助用户实现业务云原生化迁云

    「本文整理自阿里云高级开发工程师郝树伟(流生)在大会上的演讲,获取云原生专场全部 PPT 合集请在阿里巴巴云原生公众号后台回复"724"」 7 月 24 日,阿里云开发者大会正式在 ...

  2. Hadoop势微,云原生上位——传统大数据平台的云原生化改造

    以Hadoop为中心的大数据生态系统从2006年开源以来,一直是大部分公司构建大数据平台的选择,但这种传统选择随着人们深入地使用,出现越来越多的问题,比如:数据开发迭代速度不够快,集群资源利用效率过低 ...

  3. 申通快递:核心业务系统云原生化上云技术详解

    简介:如果说,快递行业上半场的竞争拼的是规模.服务乃至价格,进入下半场,快递企业们还需要比拼硬核的技术实力.--周金龙(遥方) 随着云计算的快速发展和成熟,越来越多的企业正在把自己的核心系统向云上迁移 ...

  4. 快速云原生化,从数据中心到云原生的迁移实践

    作者:刘大鹏(雨镜) 前言 云原生的时代已经到来,云原生技术正在重塑整个软件生命周期,阿里巴巴是国内最早布局云原生技术的公司之一. 容器服务团队在过去的几年时间内帮助很多用户成功把业务云原生化并迁移上 ...

  5. 阿里大数据云原生化实践,EMR Spark on ACK 产品介绍

    开源大数据社区 & 阿里云 EMR 系列直播 第六期 主题:EMR spark on ACK 产品演示及最佳实践 讲师:石磊,阿里云 EMR 团队技术专家 内容框架: 云原生化挑战及阿里实践 ...

  6. 昨日黄花Hadoop 方兴未艾云原生——传统大数据平台的云原生化改造

    本文6539字,阅读时间约20分钟 以Hadoop为中心的大数据生态系统从2006年开源以来,一直是大部分公司构建大数据平台的选择,但这种传统选择随着人们深入地使用,出现越来越多的问题,比如:数据开发 ...

  7. #阿里云原生最佳实践# 申通快递:核心业务系统云原生化上云技术详解

    随着云计算的快速发展和成熟,越来越多的企业正在把自己的核心系统向云上迁移,从而享受云计算带来的技术红利.IDC发布的<全球云计算IT基础设施市场预测报告>显示:2019年全球云上的IT基础 ...

  8. 阿里云金融创新峰会云原生分论坛圆满举办,加速金融行业落地云原生

    随着云计算在多个行业的深入应用,企业应用构建面临资源弹性.系统稳定.应用敏捷.业务智能.可信安全等新的问题和挑战,云原生已经成为云时代业务应用构建的主流模式,全面容器化.核心技术互联网化和应用 Ser ...

  9. 双11特刊 | 全面云原生化,数据库实例独共享混部 最高降低30%成本

    简介:2021年双十一是阿里巴巴集团的核心应用全面云化的第二年.今年在保证稳定性的前提下,主要探索如何利用云原生的技术优势,降低成本,提升资源利用率.在今年大促中,针对核心集群采用独享共享实例混部,统 ...

最新文章

  1. 不属于mysql常量的是_MySQL中,下面______常量的写法是不正确的?-智慧树MySQL数据库设计与应用章节答案...
  2. lvs-nat负载均衡模式
  3. python学习笔记-flask学习(一)route适配器
  4. java selenium 定位frame_webdriver 定位frameset中的frame
  5. ACM入门之【线段树】
  6. webgl内置函数--通用函数
  7. Python 编码问题:‘ascii‘ codec can‘t encode characters in position 的解决方案(中文乱码终极解决方案)
  8. linux_从windows到ubuntu再到manjaro
  9. java创建对象实例的四种方式
  10. 2021年软考网络工程师专题突破视频教程
  11. 华为认证报名费是多少?如何准备华为HCIP网络工程师考试?
  12. 咖啡加盟10年经验分享:咖啡店12种危机处理方式,提升回头客
  13. 哪里有电,哪里就应该有网络 ,华为移动路由Pro评测
  14. 解密国内BAT等大厂前端技术体系-阿里篇(长文建议收藏)
  15. R——关联规则分析(二 例题:中医证型的关联规则挖掘)
  16. Java网络编程学习
  17. 杜甫写的有关风雨的古诗有哪些
  18. layui 单元格事件
  19. 【青水评级】Ultrain超脑链项目分析
  20. UFS系列7:描述符、标识和属性

热门文章

  1. JAVA进阶开发之(异常类)
  2. python通讯录运用的知识点_案例驱动式Python学习--通讯录存取
  3. resnet50网络结构_AAAI2020 | 利用网络结构关系加速NAS+Layer
  4. golang select default continue_Golang+VSCode环境配置
  5. oracle执行sql痕迹,Oracle 查询刚执行的SQL
  6. python json模块详解_深入解析Python编程中JSON模块的使用
  7. python处理时间和日期_python时间和日期的处理
  8. PHP留言并展示_利用PHP实现简单留言板
  9. html中post语句,html中post乱码的解决方法
  10. java开源服务框架_Java框架服务