凌云时刻 · 故事

导读:阿里云基础设施首次支撑申通全站业务系统,申通的双 11 平稳顺滑,展现了无限潜力。

作者 | 筱洺、木环

来源 | 凌云时刻(微信号:linuxpk)

前言

今年双 11,申通的系统前所未有的流畅与平稳。

“双 11 全站跑在阿里云上,亿级包裹洪峰过境,千万级订单毫秒级响应,系统稳如泰山。” 申通上云的技术负责人方遥难掩骄傲地说。

“11 月 1 日凌晨第一波订单高峰到来,整个系统的响应很快,面对超过日常数倍的接单量,系统的响应时间没有变化;在接单、自动化分拣、巴枪扫描、快件跟踪等核心指标上表现稳定;相应的中间件、数据库资源的负载也在合理的区间范围内波动。”方遥在接受媒体采访时表示。

这让他对第二波订单高峰信心满满,上云后的申通系统没有让他失望。

11 月 6 日,方遥盯着屏幕上稳定运行的后台系统,像看自己的孩子。从 8 月进入双 11 备战,将近三个月的时间,经历了无数次压测,双 11 第一波结束,才算轻松下来。作为申通上云负责人,他长久的努力,也在此刻得到了最大的回报。

上云前,申通使用线下机房作为计算及数据存储平台,一到双 11 资源需求就膨胀,大促之后则闲置浪费;上云后,几乎全部的资源都是按量购买,用完双 11 就释放,真正做到了开箱即用,不产生一天浪费。与去年双 11 当天相比,今年 11 月 1 到 3 日,相比此前传统 IDC 架构方案,在业务量大幅提升的情况下,IT 投入反而降低了 30%。上云的成效显著。

全站应用容器化

弹性调度稳定高效

在设计全站上云方案之初,方遥就果断决定拥抱云原生并将所有应用 100% 容器化,技术转型的决策,是来自其强烈的危机感,2019 年快递行业业务量达到 600 亿件,申通业务量达到 73 亿件,开始向百亿件规模挺进。

选用阿里云容器服务 ACK 和容器镜像服务 ACR,可以为申通带来两大重要好处:业务快速上线、开箱即用的可靠弹性。

在这个快速多变的时代,企业业务“唯快不破”。通过云原生技术可以做到快速上线部署,

为团队培养出应用开发与运维的规范化操作,形成了将应用代码打包成容器镜像再到 K8S 标准化部署的流程,不再需要耗费大量时间人肉发布、也避免了因集群配置不一致而发生故障等问题,成功转型 DevOps 驱动公司。

其次,快递的业务是非常典型的周期性业务,在业务爆发式增长的时候,资源如何做到开箱即用?而业务突发增长,哪有比双 11 更具代表的时期呢,今年双 11 就是申通是弹性调度的绝佳试验场。

当然容器与 Kubernetes 技术带来的还有更多:依赖 Kubernetes 为核心的数据中心通过应用编排、业务故障自愈的能力让整个系统更稳;通过监控埋点、业务日志收集、链路监控等手段保证了在快速迭代过程中业务系统的稳定性;通过对计算资源的水位监测,结合业务的峰值情况,弹性扩缩容或降低配规格数量,可以降低整个资源的费用等等。

这个云原生化全站迁云的战役,一场耗时一年有余。

经过数不胜数的需求沟通与技术改造,在申通与阿里云同学们的不断努力下,申通最终成功实现采用云原生技术和架构实现核心业务搬迁上阿里云。

这个决策,为今年双 11 技术创新埋下了伏笔:比如,应用弹性伸缩大大降低计算成本,一年节省数百万;又比如,快速上线更多创新业务,今年双 11 的预售商品提前下沉到用户附近,楼上下单楼下发货,提升顾客体验。

“上云只是一个开端,云只是基础设施。”方遥说,“申通的技术架构会朝着下一代微服务架构 Mesh 演进,提升复杂系统的可治理性。”

阿里云神龙裸金属方案

支撑申通平滑渡过双 11

申通核心业务系统原架构基于 VMware+Oracle 数据库进行搭建。随着搬迁上阿里云,架构全面转型为基于 Kubernetes 的云原生架构体系。其中,引入云原生数据库并完成应用基于容器的微服务改造是整个应用服务架构重构的关键点。

综合考虑申通实际业务需求与技术特征,最终选择了「阿里云 ACK+ 神龙裸金属 + 云数据库」的云原生解决方案,实现核心应用迁移上阿里云。

阿里云 ACK+ 神龙裸金属方案,于 2020 年 609 云峰会上重磅发布。申通云原生上云的基础设施,就全部使用了阿里云的神龙裸金属服务器。相较于一般云服务器(ECS),Kubernetes 搭配神龙服务器能够获得更优性能及更合理的资源利用率且云上资源按需取量,对于拥有大促活动等短期大流量业务场景的申通而言极为重要。

首先,云原生裸金属方案,可以满足业务快速发放和弹性的要求。神龙裸金属服务器可分钟级完成实例创建和启动,并利用 Kubernetes 的调度和编排能力,通过阿里云容器 K8S 服务与阿里云基础设施的紧密协同(SLB、VPC、NAS、SLS 等等),在非常短的时间内,支持业务极速部署,轻松应对瞬时峰值场景对系统敏捷性的要求。

第二,神龙裸金属的性能,加上容器的弹性,形成了天作之合。“容器+神龙裸金属”的解决方案非常契合像双 11 这种大流量、高并发的场景。

神龙裸金属是云原生的最佳载体,它规格较高,可以实现高密度容器部署。同时,神龙服务器的性能优势明显, 它完全消除了虚拟化损耗,提升 8% 的计算性能,其类物理机特性,可进行二次虚拟化。新一代容器服务 ACK,可以将最新神龙弹性裸金属实例的强大性能发挥得淋漓尽致。

数据显示,容器运行在云上神龙反而比非云物理机的性能要好 10%~15%。因为神龙云服务器不仅无虚拟化开销,而且运行在神龙上的每个容器都可以独享弹性网卡 ENI,能提升 13% 的网络吞吐量。

结语

如果说,快递行业上半场的竞争拼的是规模、服务乃至价格,进入下半场,快递企业们还需要比拼硬核的技术实力。

阿里云基础设施首次支撑申通全站业务系统,申通的双 11 平稳顺滑,展现了无限潜力。

在申通内部看来,“双 11”的逆袭也意味着被申通称为数字化 1.0 的阶段全部完成。在技术的最终规划中,跨过 2.0 达到达数字化 3.0,必须构建起一个申通大脑,这个大脑不仅包揽一切,还可以自我迭代,是申通智能人格的终极象征,这才是申通自动化转型的终极目标。

参考文章:

1. 双 11 即将开启第二波 申通跑在阿里云上怎么样?

2. 迎战超长待机“双 11” 申通为何选择数字化转型这剂猛药?

3. 申通快递全面迁移阿里云 成快递全面上云第一家

4. 阿里云发布云原生裸金属方案:裸金属+容器,解锁云计算的新方式

5. 停课不停学,阿里云“神龙+容器”帮助在线教育企业构建高质量课堂

6. 申通和民生银行入选信通院云原生应用十大优秀案例,揭秘云原生与数据中台的正确打开方式

END

往期精彩文章回顾

技术人成长路径之我见

容器技术20年:容器引擎与江湖门派

如何保障“双11”期间亿万买家和卖家愉快地聊天

ECS自助服务之智能诊断和自动化修复

AI 云原生浅谈:好未来 AI 中台实践

云上高弹性、低成本解决方案

我眼中的解决方案架构师

饿了么技术往事(中)

饿了么技术往事(上)

阿里云落地全球最大云原生实践:双11核心系统全面云原生化

长按扫描二维码关注凌云时刻

每日收获前沿技术与科技洞见

申通完美支撑“双11”亿级包裹背后的云基础设施相关推荐

  1. 申通完美支撑“双11”——亿级包裹背后的云基础设施

    简介: 亿级包裹洪峰过境,千万级订单毫秒级响应,系统稳如泰山.今年双11,申通的系统前所未有的流畅与平稳. 今年双11,申通的系统前所未有的流畅与平稳 "双11全站跑在阿里云上,亿级包裹洪峰 ...

  2. Hologres是如何完美支撑双11智能客服实时数仓的?

    简介:本文重点介绍Hologres如何帮助阿里巴巴客户体验部(CCO),构建集实时化.自助化.系统化于一体的用户体验实时数仓,完美助力双11场景,支持上千+服务大屏,削峰30%,节约成本近30%. 刚 ...

  3. 大赞!资深T9专家全新打造京东双11亿级网站架构系统手册

    前言 经历过"双11"和"618"的同学都知道,在大促时如何保证系统的高并发 .高可用是非常重要的事情. 因此在备战大促时,有些通用原则和经验可以帮助我们在遇到 ...

  4. 阿里巴巴如何对抗淘宝双11亿级流量?这本P9纯手打并发手册送给你

    淘宝双11,京东618,滴滴打车高峰如何抗住亿级的并发量? 这一份阿里P9纯手打的高并发系统设计手册帮你解决!这份手册分为基础篇.数据库篇.缓存篇.消息队列篇.分布式服务篇.维护篇.实战篇 新鲜出炉的 ...

  5. 阿里如何抗住双11亿级并发量(深度好文)

    作者:huashiou 链接:https://segmentfault.com/a/1190000018626163 1.概述 本文以淘宝作为例子,介绍从一百个并发到千万级并发情况下服务端的架构的演进 ...

  6. Mobvista亿级流量背后的云服务架构支撑

    Mobvista联合创始人.技术VP黄伟坚接过我的名片时,兴奋地说:"我们在北京也有办事处".这也让我能深切的感受到其作为Mobvista一员的骄傲.成立于2013年的Mobvis ...

  7. 第五章 业务架构,5.5 菜鸟双11“十亿级包裹”之战(作者:兰博)

    5.5 菜鸟双11"十亿级包裹"之战 前言 每年的双11都在刷新物流的世界奇迹,但由于大数据和协同,每次都将看似不可能完成的任务加速完成.以2013年-2016年的一组数据为例,从 ...

  8. 菜鸟双11“十亿级包裹”之战

    前言 每年的双11都在刷新物流的世界奇迹,但由于大数据和协同,每次都将看似不可能完成的任务加速完成.以2013年-2016年的一组数据为例,从签收时间看,2013年双11包裹签收过1亿用了9天,201 ...

  9. 重塑技术引擎 阿里落地全球最大规模云原生实践支撑双11

    4982亿,2020年天猫双11再创消费新纪录.58.3万笔/秒,双11交易峰值再创新高,阿里云又一次扛住全球最大规模流量洪峰.这一切背后支撑的"技术引擎"又是如何为近十亿全球购物 ...

  10. nc65数据字典 云盘_从搜索引擎到核心交易数据库,详解阿里云神龙如何支撑双11...

    2020年的双11,天猫又创造了新的纪录:订单峰值达到创纪录的58.3万笔/秒,销售额达到历史新高4982亿,阿里云神龙再次成功扛住了全球流量洪峰.2020年是双11全面云原生化的第一年,也是神龙架构 ...

最新文章

  1. PL/SQL -- 动态SQL
  2. android键盘弹出头部上移处理
  3. AutoML Vision教程:训练模型解决计算机视觉问题,准确率达94.5%
  4. 我是大富豪php源码,最全大富豪3.4源码【自用可运营】含23款子游戏+可控制输赢工具...
  5. 谈谈cookie的弊端
  6. 浅谈高并发系统性能调优
  7. javascript之继承
  8. clob存base64文件存不进去_工行信用卡这几个提额方法,你知道吗?一般人我不告诉他!...
  9. aix查看文件夹大小命令_轻松掌握 Linux 命令(1):ls 命令
  10. 显著性检测(saliency detection)评价指标之KL散度距离Matlab代码实现
  11. [数位DP]JZOJ 3363 Number
  12. SQL Server | Mysql 对表的unique 的实现方式
  13. Hash表、Hash函数及冲突解决
  14. 中国十个亡国之君的退位诏书
  15. 雷云3编辑使用宏鼠标连点
  16. 如何查询目标计算机的ip地址,基于Wireshark获取目标ip地址
  17. Windows 下取消活动分区的方法
  18. 服务器路由器无线ap,TP-Link TL-WR841N路由器无线AP设置方法
  19. docker MySQL 双主_DockerMysql数据库实现双主同步配置详细·TesterHome
  20. 实现动态基础架构 容易吗?

热门文章

  1. loadrunner 打印变量
  2. hadoop集群全纪录
  3. 设计模式17---设计模式之模板方法模式(Template Method)(行为型)
  4. 与其他库一起使用jQuery
  5. Mybatis-学习笔记(2)Mybatis配置文件
  6. iOS 混合开发 —— 方案分析
  7. toLocaleTimeString()方法在IE和谷歌浏览器上 根据本地时间格式,把 Date 对象的时间部分(不含日期)转换为“时间字符串”存在区别...
  8. FormsAuthentication使用指南
  9. State Machine Workflow 入门篇
  10. C/C++ 内存四区模型