点击文末“阅读原文:,下载《不一样的 双11 技术:阿里巴巴经济体云原生实践》

2019 双11,订单创新峰值达到 54.4 万笔/秒,单日数据处理量达到 970PB,面对世界级的流量洪峰,今年的阿里交出了一份亮眼的云原生技术成绩单,并实现了100% 核心应用以云原生的方式上云:

  • 双11 基础设施 100% 上云

  • 支撑 双11 在线业务容器规模达到 200 万

  • 采用神龙弹性裸金属服务器计算性价比提升 20%

这些数据背后是对一个个技术问题的反复尝试与实践。这一次,我们对云原生技术在 双11 的实践细节进行深挖,将 22 篇代表性的文章进行编排,整理成书《不一样的 双11 技术:阿里巴巴经济体云原生实践》旨在为行走在云原生路上的开发者打开新思路、提供一些有益的参考。

蒋江伟(小邪)

阿里云基础产品研发负责人 蒋江伟

许多经过精心设计的架构,平时运行稳定,但在 双11 的演练中都暴露出了大量的细节问题,双11 这个独一无二的场景是阿里技术的试金石。今年 双11,我们把“最要命”的系统全都放到了云上,实现了核心系统 100% 上云,撑住了 双11 的世界级流量洪峰。

这离不开云原生技术的创新,希望本书能对开发者和企业客户产生借鉴意义,共享云计算技术红利。

—— 小邪

丁宇(叔同)

阿里云云原生应用平台负责人

在 All in Cloud 的时代企业 IT 架构正在被重塑,而云原生已经成为释放云计算价值的最短路径。2019 年阿里 双 11 核心系统 100% 以云原生的方式上云,基于神龙服务器、轻量级容器和兼容 K8s 的调度、集群管理技术,通过云原生开放应用模型 OAM,构建高效和自动化的应用交付体系,大大加快了上云速度;通过升级微服务和服务网格,将服务治理与应用解耦并下沉到基础设施层,提升治理能力和迭代速度,整体向 Serverless 极致弹性、按用计费、无需运维的架构演进,全面实现核心系统上云,让双 11 更稳定让业务创新更敏捷。

希望通过将阿里的上云和云原生技术落地最佳实践通过电子书的形式输出,对开发者和企业客户产生借鉴意义,加速技术演进共享云计算技术红利。

——叔同

我们采访了上云总架构师毕玄,以下是他们对于 双11 核心系统 100% 上云背后云原生的技术思考。

林昊(毕玄)

上云总架构师

与客户在同一架“飞机”上


王坚院士曾在很多场合都和阿里的技术人员讲到:阿里云作为一家输出技术的公司,我们需要做到和我们的客户在同一架“飞机”上,而不仅仅是“造飞机”或看着“飞机”在空中飞,阿里经济体云化最重要的就是要做到让我们和客户在同一架“飞机”上。

早在几年前,阿里巴巴经济体就开始借助阿里云的机器资源来支撑 双11 零点的高峰,云的弹性资源优势使得 双11 的机器资源投入成本下降超过 50% 以上,但在这些机器资源上部署的却是我们自己的技术体系,例如容器、中间件、数据库、缓存等,也就意味着我们和客户其实是在不同类型的“飞机”上,而且阿里巴巴经济体在的“飞机”是专为阿里巴巴定制打造的,外部客户是买不到的,这是一个典型的从 Hosting 演进到 Cloud Hosting 的阶段。为了切实做到和客户在同一架“飞机”上,在今年 3 月份,阿里云智能事业群 CTO 张建锋(花名:行癫)正式对外宣布未来一到两年,阿里巴巴百分之百的业务要跑在公共云上,成为“云上的阿里巴巴”。

从 Cloud Hosting 到 Cloud Native


阿里巴巴经济体云化是阿里技术发展史上继之前的分布式架构、异地多活后的又一轮巨大的架构升级,这次架构升级需要把我们从 Cloud Hosting 演进到 Cloud Native,Cloud Native 作为技术圈最火热的名词,不同的人的眼中有不同的定义,我们认为 CloudNative 带来的是一次系统构建方式的巨大变革,Cloud Native 是指业务系统的构建从基于自有、封闭的技术体系,走向基于开放、公共的 Cloud 的技术体系。

在 Cloud Native 时代之前,多数公司随着业务的发展,或多或少都会打造出自有、封闭的技术体系,这一方面造成了巨大的投入,使得公司的技术人才力量没有完全专注的投入在业务上,另一方面也造成了这个行业人才流动的困难,因为知识体系的不同,每到一家新的公司几乎都是全新的一套,这个一定程度上影响了业务创新的速度,尽管很多的开源产品在一定程度上有助于解决这个问题,但还不足以体系化,而在 Cloud Native 时代,我们认为会有两个典型的特征:

1、对于业务系统端而言,在做系统设计的技术选型上,Cloud 提供了远比自有技术体系更为丰富了多的选择,这使得架构师可以更好的根据业务的状况、阶段等来进行更合理、合适的技术选型,最后表现出来的特征会是业务系统基于 Cloud 的技术体系来搭建,而越来越少的自建或自研,就像 Cloud Hosting 带来的越来越少的公司自己 Hosting 机器的变化一样;

2、对于云厂商而言,会提供越来越多开放、主流的技术栈的技术产品,从而让客户有更为丰富和自主的选择权,同时云厂商会去做到让这些技术产品的互通性更好,这样客户才能真正做到对于不同类型的业务选择不同的技术产品和体系。

按照这样的思路,阿里巴巴经济体云化在走向 Cloud Native 的道路上,我们的原则是:

1、业务系统不再采用自有、封闭的技术产品,而是阿里云上对外提供哪些技术产品,我们就基于这些来重构、新建我们的业务系统;

2、阿里云上提供相应技术领域的主流技术产品,同时根据阿里业务的需求去新增、完善、改造相应的技术产品,并增强不同技术产品的互通性、开放性。

按照这样的原则,随着阿里经济体云化项目的进展,阿里的业务系统就必将完成从基于自有、封闭的自有体系构建,进化到和阿里云的客户一样,基于阿里云上公共的技术产品的体系来构建,从而实现和客户在同一架“飞机”上。

不一样的双11,云原生技术亮点


在这个双11,我们在以下几个方面有了一些不错的进展:

超大规模 Kubernetes 实践 

2017 年下半年,阿里集团开始尝试使用 Kubernetes API 来改造内部自研平台,并开始了对应用交付链路的改造,以适配 Kubernetes。2018 年下半年,阿里集团和蚂蚁金服共同投入 Kubernetes 技术生态的研发,力求通过 Kubernetes 替换内部自研平台,实现了小规模的验证,支撑了当年部分 双11 的流量。

2019 年初,阿里经济体开始进行全面上云改造,阿里集团通过重新设计 Kubernetes 落地方案,适配云化环境,改造落后运维习惯,在 618 前完成了云化机房的小规模验证。2019 年 618 之后,阿里集团内部开始全面推动 Kubernetes 落地,在大促之前完成了全部核心应用运行在 Kubernetes 的目标,并完美支撑了 双11 大考。

阿里巴巴超大规模 Kubernetes 落地,经受了双11大促真实场景的考验, 单集群能支撑万级别 Node、十万级别 POD 的规模。我们推进了三个方面改造:面向终态的改造;自愈能力改造;不可变基础设施改造。相比原有传统的运维链路,扩容效率提升了 50%,集群节点在线率达到了99.9%以上。

阿里巴巴云原生化的最佳组合:Kubernetes+容器+神龙

今年 双11,我们通过 K8s+容器+神龙的最佳组合实现了阿里核心系统 100%以云原生的方式上云,完美支撑了 54.4w 峰值流量以及 2684 亿的成交量。基于 0 虚拟化开销的神龙裸金属,通过使用行业标准的容器与调度、编排、管理技术,推动经济体云原生技术全面升级。容器性能提升 10%、神龙节点可调度率达到 99% 以上、容器稳定性与在线率全面提升。

Service Mesh 超大规模落地

阿里巴巴在 双11 的部分电商核心应用上落地了完整的 Service Mesh 解决方案,借助 双11 的严苛业务场景完成了规模化落地前的初步技术验证;蚂蚁金服也实现了 Service Mesh 的大规模落地。Service Mesh 所带来的变化体现于:服务治理手段从过去的框架思维向平台思维转变;技术平台的建设从面向单一编程语言向面向多编程语言转变。

Service Mesh 创造了一次以开发者为中心去打造面向未来的分布式应用开发平台的机会,给其他技术产品创造了重新思考在云原生时代发展的机会,给技术基础设施如何与业务基础技术更好地协同提供了一次探索机会,并为探索面向未来的异地多活、应用永远在线的整体技术解决方案打开了一扇大门。

点击文末“阅读原文”,下载《不一样的 双11 技术:阿里巴巴经济体云原生实践》

/点击图片,报名参加/

本文缩略图:icon by 无风止境

Tips:

# 点下“在看”❤️

# 然后,公众号对话框内发送“CNCF”,试试手气?????

# 本期奖品是CNCF正版指尖陀螺

重磅下载 | 核心系统 100% 上云,揭秘双11背后的云原生实践相关推荐

  1. 重磅下载 | 核心系统100%上云,揭秘双11背后的云原生实践

    2019 双11,订单创新峰值达到 54.4 万笔/秒,单日数据处理量达到 970PB,面对世界级的流量洪峰,今年的阿里交出了一份亮眼的云原生技术成绩单,并实现了100% 核心应用以云原生的方式上云: ...

  2. 核心系统100%上云!全球最大流量洪峰,阿里云扛住了

    2019天猫双11 96秒成交额破100亿 全球最大流量洪峰 每秒订单峰值54.4万笔 阿里巴巴核心系统 100%上云 我们扛住了! 1心1役 把不可能变成可能 今晚为阿里工程师疯狂打call! 原文 ...

  3. 揭秘2019双11背后的云网络 – 双11网络架构和洛神系统

    图1 天猫双11成交额 2019年天猫双11成交额,2684亿!核心系统100%上云!全球最大流量洪峰,阿里云扛住了.  狂欢背后的技术栈 网上轻松购物体验实际上是背后复杂的技术组成的,这是一个简化 ...

  4. 【直播回顾资料下载】Work Like Alibaba第三期:揭秘双11背后的技术支撑

    阿里巴巴逐年增加的双11营业额和不断创新的业务背后隐藏着怎样的秘密? 阿里走过的这18年,它用怎样的工作方法.工作形式打造出高效.创新的企业帝国? Work Like Alibaba社区活动带你全方位 ...

  5. 双11背后的技术力量,阿里云神龙治愈云计算阿克琉斯之踵

    边策 发自 凹非寺  量子位 出品 | 公众号 QbitAI 导语:自计算机诞生以来,计算性能一直是科技产业发展的标尺.过去数十年提升芯片制造工艺.堆叠核数是性能演进的标准路线,摩尔定律约束下性能增长 ...

  6. 揭秘 | 连续3年支撑双11,阿里云神龙如何扛住全球流量洪峰?

    简介:2019年云栖大会,阿里云正式发布第三代自研神龙架构,全面支持ECS虚拟机.裸金属.云原生容器等,贯穿整个IaaS计算平台,并在IOPS.PPS等方面提升5倍性能,用户能在云上获得物理机100% ...

  7. 双11特刊 | 全面云原生化,数据库实例独共享混部 最高降低30%成本

    简介:2021年双十一是阿里巴巴集团的核心应用全面云化的第二年.今年在保证稳定性的前提下,主要探索如何利用云原生的技术优势,降低成本,提升资源利用率.在今年大促中,针对核心集群采用独享共享实例混部,统 ...

  8. 双11专刊|云原生数据仓库AnalyticDB支撑双11,大幅提升分析实时性和用户体验

    简介:2021年双十一刚刚落幕,已连续多年稳定支持双十一大促的云原生数据仓库AnalyticDB,今年双十一期间仍然一如既往的稳定.除了稳定顺滑的基本盘之外,AnalyticDB还有什么亮点呢?下面我 ...

  9. 专访阿里巴巴魏虎:揭秘阿里双11背后的全站个性化商铺千人千面

    12月6日-7日,由阿里巴巴集团.阿里巴巴技术发展部.阿里云云栖社区联合主办,以"2016双11技术创新"为主题的阿里巴巴技术论坛(Alibaba Technology Forum ...

最新文章

  1. 海量数据处理利器之Hash——在线邮件地址过滤
  2. thinkphp当前php路径,分析thinkphp常见路径用法分析
  3. 远程包含shell时,上传shell时所遇到一句话木马不能上传问题解决的办法(这里为单引号与双引号问题)
  4. flask 实现异步非阻塞----gevent
  5. c4d计算机丢失api-ms,SVsSccManager Interface
  6. 【Django 2021年最新版教程24】循环得到2个日期之间的所有日期
  7. 清华OS前置知识:80386处理器
  8. java通过winrm实现remote powershell
  9. 小麦颗粒数目matlab,求关于matlab中rice.png图像中的米粒数目的算法
  10. Navicat 将 psc备份文件还原
  11. 人工智能吹来的是失业的寒风还是发展的春风?
  12. 【框架设计】3D坦克大战
  13. 苹果app没删但是桌面找不到
  14. mysql分组取最新
  15. java程序员语录_java程序员励志说说26条
  16. 注解—— java.lang.annotation.Annotation
  17. python 行向量、列向量 和矩阵
  18. python编程1-win7上运行python
  19. 信息安全技术——(三)标识与认证技术
  20. 宽带服务器光信号亮红灯,宽带的光信号一直闪红灯是为什么

热门文章

  1. 公交线路提示(课设)
  2. python动画显示乌龟绘图源码精简版
  3. 五元组及不同组网方式的传输流程
  4. 如何在一天内为你的实验室做一个网站
  5. 2021-04-27 MIME
  6. 【ODX Studio编辑PDX】-0.3-如何删除/修改Variant变体中继承的(Inherited)元素
  7. 风压和功率计算公式轴流式_风机的风压、风量、功率与转速有什么相互关系?...
  8. 测试工程师用 Shell 定位 Bug 的正确姿势 | 福利
  9. win10启动项_Win10系统上安装macOS,不破坏Win10也不丢文件,双系统非虚拟机
  10. WC2015 k小割(k短路+暴力+搜索)