凌云时刻

注:本文作者祝顺民(花名江鹤),阿里云智能事业群研究员、网络产品负责人,在软件定义网络(SDN)和网络功能虚拟化(NFV)领域有多年技术研发和管理经验。带领团队从无到有,打造了业内最丰富的云网络产品线,并研发了阿里云飞天系统的云网络平台-洛神,历经10年双十一考验。

云计算的广泛使用正在改变云原生的定义,云原生正从狭义的云原生定义,即“微服务+容器+持续交付+DevOps”,向广义的云原生定义转变,即“因云而生的软件、硬件、架构就是真正的云原生”。云网络作为云计算标配的IaaS核心产品线,第一天就是依云而生,更是生而为云的,是真正云原生的网络。

当中年的网络遇见牙牙学语的云计算

1969年,美国国防部高级研究计划管理局建立了一个名为ARPAnet的网络,这被普遍认为是网络的开端。ARPAnet形成的TCP/IP体系结构和协议到今天还是网络世界的基础。随后的几十年里,网络在快速发展,到2009年,移动网络从1G、2G已经发展到了3G,我们使用的应用也从最早的电话、短信发展到图形、聊天、购物。这些应用的发展都离不开网络,可以说网络的发展驱动了应用的变革。同年,工信部正式为三大运营商发放了第三代移动通信(3G)牌照,从这一刻起,中国正式进入了3G时代。

2009年数据中心服务器的网卡大都还是1000M,到了2010年5月10日,阿里云对外发布第一个商业化的产品-云服务器ECS,正式提供公共云服务,标志着中国云计算公共云服务的开篇。

彼时,网络已经发展了40年,已经步入中年,而云计算刚刚诞生,还是牙牙学语的新生儿,中年网络遇见新生云计算会碰撞出怎样的火花呢?那时候,可能很多人都没有想到,云计算对网络的影响会如此之大。

2012年底,随着虚拟化技术的发展,单物理机的虚拟比在逐步提高,对网络设备提出了非常高的要求,当时全世界都已经找不到满足业务虚拟比的网络设备了。除此之外,当时的网络架构还存在成本、稳定性、性能等多方面的问题,这些问题极大地影响了云业务的开展。与此同时,随着更多用户上云,尤其是大型互联网企业和传统企业的上云,用户对云上网络管理需求也与日俱增。比如,用户在云上多地域部署业务,需要多地域内网互通,或者用户需要把云下IDC和云上网络互通,构建混合云等等,而这些网络管理能力,当时云上的传统网络架构都难以满足。

中年网络和新生云计算发生了激烈的冲突,已到中年的网络必须创新才能满足新生儿“云计算”的快速发展需要。

2012年,阿里云率先放弃传统的大二层传统网络架构,设计新的网络虚拟化(Overlay)技术方案。2014年阿里云虚拟专有网络VPC产品正式上线,VPC是中年网络和新生云计算结合的产物,VPC也是云网络的标志性产品,验证了“网络+云计算=云网络”公式的成立。因此,从第一天起,云网络就是因云而生的。

云网络是天生具备云特征的网络

云网络因云而生,天生具备云的特征。

 首先是资源共享。通过将网络资源虚拟化,使用Overlay技术实现多租户共享网络资源,但租户间又是安全隔离的。Overlay技术让每个用户都可以像使用虚拟机一样使用云网络,包括使用虚拟交换机/虚拟路由器/虚拟负载均衡等等。

 其次是弹性伸缩。对于传统设备来说,设备买回来,处理性能就确定了,难以弹性伸缩。云网络为了应对弹性伸缩的,将控制面与转发平面进行分离部署,并且采用集群的方式支持扩展,结合网络虚拟化技术为每个用户提供了弹性网络能力。

 再次是自助服务。这是从用户视角看到的云网络与传统网络的最大区别。传统网络需要专业网络管理员敲CLI(Command Line)命令行进行配置,而云网络API和控制台,用户可以很轻松完成云网络搭建。

 最后是按需付费。企业使用传统网络设备,即使利用率不到30%,为了一定的弹性,也只能超额购买,而云网络采用按需付费,企业根据实际使用量进行收费,用多少付多少钱,这也是传统网络所不具备的。

云网络的发展历程

云网络发展经历三个阶段,2009年的云网络1.0,即云数据中心网络;2016到2020年的云网络2.0,是云广域网络,再到2020年开始的云网络3.0,是应用-云边一体网络。在不同的阶段,云网络给用户提供了不同的产品能力,满足用户的网络需求。

 云网络1.0是云数据中心网络,是为用户在云上提供构建数据中心网络的产品能力。用户可以通过点点鼠标,创建VPC、虚拟交换机、虚拟路由器,构建数据中心网络环境,再通过EIP,负载均衡SLB,NAT网关等产品实现互联网访问。

 云网络2.0的核心是云广域网络,用户在云上多地域部署业务系统后,很自然的需求就是多地域内网互通,另外,用户还有云下IDC和云上VPC互通的需求,云广域网络可以很好的满足用户这两个业务场景的需求。2017年,阿里云在业内率先发布云企业网CEN,用户可以非常简单快速的构建一张全球化网络。2018年,阿里云还发布了云原生SD-WAN产品-智能接入网关SAG,方便用户快速上云。云网络2.0让用户轻松构建一张云上云下一体的全球网络。

 2020年,5G/IoT/边缘计算技术的发展,社会进入万物互联和产业互联网时代,云计算已经成为整个数字社会的基础设施云网络也开启了3.0时代。云网络作为数字化社会的高速公路,将会拓展到边缘,并和应用产生更好的协同,让万物互联,助力产业互联网的发展。

基于云原生的洛神云网络技术

云网络因云而生,依云而建,第一天就采用全自研的方式,走出了一条基于云原生特有的云网络技术之路。包括大规模SDN控制技术、Sailfish软硬件一体转发技术、CyberStar弹性网元技术等。

 自研大规模SDN控制器,让用户不再担心规模和复杂度

SDN控制器是规模和管理效率的关键。云原生趋势下,大量用户基于云使用Docker和K8s,这对云网络的规模和密度提出了很大的挑战。SDN控制器可以满足用户每VPC容纳100万实例的超大规模需求,也可以满足用户对单个ECS的高密度弹性网卡需求。此外,在公共云大规模背景下,管理效率也非常关键。包括用户配置变更的实时性、易用性等,这些都是基于云原生构建的SDN控制器优势所在,让用户不用再担心规模和复杂度问题。

 自研软硬一体的Sailfish转发平台,让用户不再担心性能问题

Sailfish硬件转发平台基于专用可编程芯片、智能网卡等高性能转发组件,通过软硬件一体架构设计,构建主机和基础网关高性能转发能力。包括软硬件一体高性能网关XGW、MOC卡、ALI-LB等核心模块,目前广泛应用在云网络的各个场景。如下图所示:

XGW网关负责公网、专线和跨Region流量的汇聚和分发。MOC卡是服务器内部网络核心组件,负责服务器内部ECS流量的转发和交换。XGW网关和MOC卡一起为客户搭建一张虚拟专用网络。在这张虚拟专用网络中,典型场景如下:

1)用户经internet(公网)访问阿里云,使用的典型产品有EIP和共享带宽;

2)用户IDC访问阿里云,使用的典型产品有高速通道(专线);

3)云上跨地域通信,如北京地域ECS访问深圳地域ECS,典型产品有CEN;

网络设备的演进始终呈螺旋式发展态势,围绕着灵活性和高性能,软件和硬件在相互融合、相互促进。从最开始的硬件转发设备,到软件转发设备,再到目前硬件卸载的软硬一体化转发设备以及大行其道的可编程转发设备。灵活性和高性能就像一只无形的手,引导着技术的持续发展。

而在这方面,云计算服务商的驱动力更大,促使云网络的研发走在了业界的前面。以阿里云自研软硬件一体高性能网关XGW为例。有客户提出通过高速通道(专线)构建混合云,对专线带宽的需求是10Tbps!如果采用原有的x86服务器构建,即使采用高性能服务器,考虑一定的冗余性,也需要近百台服务器,不管是成本还是运营效率都是服务接受的,这促使云网络研发出软硬件一体的高性能网关XGW。

阿里云自研软硬件一体高性能网关XGW

XGW乍一看像一台2U的服务器,主要部件有负责大流量转发的P4可编程交换芯片,负责大表项转发的自研网卡芯片,负责业务编排和智能调度的CPU模块。目前单机可以支持3.2Tbps,已经在线上规模使用,让用户不用再担心性能问题。

CyberStar弹性网元平台,让用户真正按需弹性,让投资更有效。

随着更多大型企业用户上云,用户对弹性的要求越来越高,特别是视频直播、电商大促等业务场景,经常提出突增百倍甚至千倍的弹性需求。此外,用户对新功能的交付时间也有很高的期望,平台也希望能尽快满足用户需求。在这样的背景下,原有的基于x86服务器构建的技术架构就不能满足业务需求了。在电商大促场景,公共云用户众多,平台也不知道到底多少用户会进行大促,一旦用户弹性需求出现,需要用大量负载均衡SLB,此时再去购买和部署x86服务器,扩容SLB集群就为时已晚。

因此,基于云原生的ECS构建弹性就是自然选择。CyberStar弹性网元平台最大的特点是网元不再直接部署在裸金属服务器或专用计算资源池内,而是基于公共云上ECS部署,基于ECS构建意味着资源“无限”,弹性“无限”,让业务网元不再依赖传统x86物理服务器部署,解决了采用物理服务器部署扩容长、弹性扩展困难等问题。目前,CyberStar弹性网元平台广泛应用在应用负载均衡ALB,NAT网关,PrivateLink,CEN-TR,全球加速GA,VPN网关等核心产品。应用负载均衡ALB提供每实例100万QPS能力,并可“无限”弹性,真正做到让用户按需弹性。

未来展望

2020年,IDC FutureScape认为云专用设备化是一大趋势, IDC预测到2024年,公共云上超过25%的新工作负载将使用服务商的专用基础架构组件。然而,在云网络领域,这一趋势更快,使用软硬件一体技术研发的云原生的专用设备已经成为云网络业务场景的主流,使用基于云原生的ECS构建的CyberStar弹性网元平台也正在大规模使用。

未来云网络技术会持续向这两个方向演进,依赖云原生构建技术架构,是云网络的核心优势所在。云网络,依云而生,生而为云,是真正云原生的网络。(完)

说明:本文为「凌云时刻」原创文章,转载请遵守转载要求,并务必保留作者和出处。

你可能还想看

1. 阿里云张毅萍:构建边缘云全站加速网络体系

2. 一文读懂:云上用户如何灵活应用定制化网络服务

3. 云上技术 | 混合云管理平台多Region架构

4. 从原子操作走向模板部署,详解云上资源自动化部署新模式

5. 企业如何高效用云?资深运维架构师细说云架构下的运维体系构建

END

每日收获前沿技术与科技洞见

投稿及合作请联系邮箱:lingyunshike@163.com

阿里云祝顺民:因云而生的云原生网络相关推荐

  1. 阿里云祝顺民(江鹤):云原生SDWAN加速企业上云 引领未来智能网络

    第二届中国SD-WAN峰会于11月16日在北京盛大开幕,阿里云以黄金赞助商之名隆重参与.作为全球前三,亚太第一的云计算厂商,阿里云一直引领云网技术的演进及应用落地.过去一年,阿里云发布以云为中心的云原 ...

  2. 阿里云祝顺民:生而为云,连接增长

    12 月 1 日,第二届中国云网络峰会在线上举办,阿里云受邀出席.阿里云智能 云网络产品线总经理 & 达摩院 XG 实验室负责人 祝顺民在主论坛做了<云网络:生而为云,连接增长>的 ...

  3. 深耕5G云专网,阿里云祝顺民入选“2022年度5G创新人物”

    2022 年,5G 商用发展成效显著,正在加速产业数字化,全面赋能经济社会发展.运营商 5G 投资超过 4000 亿元,共带动 8.6 万亿元的经济产出,而这一切离不开奋战在 ICT 行业的 5G 应 ...

  4. 阿里云祝顺民:算力网络架构的新探索

    近日,2022 中国算力大会在济南举办.会上,阿里巴巴集团研究员.阿里云云网络产品线总经理.达摩院 XG 实验室负责人祝顺民进行了题为<新型算力网络,赋能东数西算>的专题演讲.本文进行核心 ...

  5. 智能时代 算力赋能 | 有孚云·智算上线-聚智云算,向新而生!

    在数字经济时代,算力已经成为新时代的生产力,全球战略竞争的新焦点,为千行百业的数字化转型提供基础动力. 今日,为了满足市场方面不断涌现的多样化算力需求,为推动算力服务全面升级,加速推广算力应用落地,助 ...

  6. 一群阿里人如何用 10 年自研洛神云网络平台?技术架构演进全揭秘!

    [CSDN 编者按]逍遥子曾说,对阿里人来说「打仗是最好的团建,参加过双 11 的叫战友」,同样,参加过多次双 11 考验的系统技术都会成为真正意义上的基础设施,阿里云飞天系统的云网络平台洛神就是如此 ...

  7. 阿里技术专家光锥:亿级长连网关的云原生演进之路

    光锥 阿里巴巴新零售淘系技术 读完需要 20 分钟 速读仅需 5 分钟 AServer 接入网关承载整个阿里集团的入口流量,负责亿级用户的长链保活,支持上万路由策略转发,是连接上亿用户与后端几十万服务 ...

  8. 【阿里云】Apsara Clouder云计算专项技能认证-云服务器ECS入门,考试真题分享

    以下是阿里云Apsara Clouder云计算专项技能认证-云服务器ECS入门真题汇总篇分享: 1.下列哪一个不是重置ECS密码的步骤? A. 查看实例详情 B.进入控制台 C.远程连接ECS D.点 ...

  9. 一次云上病毒事件的应急响应——阿云的阿里云安全技术实践(1)

    [TOC] 一点惆怅 自打从老东家辞职后,阿云加入了一个新兴的互联网企业.新.老公司运维模式完全不一样,这里没有 IDC 机房,也没有传统的防火墙,更没有天天"救火"的匆忙.作为一 ...

  10. 阿里云蒋林泉:弹性计算全景图解读 | 云栖大会

    编者按:10月20日,在云栖大会·云计算产业升级峰会上,阿里云弹性计算产品技术全景图对外发布.作为弹性计算的技术底座,神龙计算平台以领先的技术保障着阿里云弹性计算的安全稳定.性能强劲和弹性灵活.本次大 ...

最新文章

  1. PostgreSQL运维实战精讲之“postgresql源码安装”
  2. SylixOS 系统初探
  3. 在Kubernetes上运行SAP UI5应用
  4. Python 中的range,以及numpy包中的arange函数
  5. PS制作棱镜化多边形照片效果
  6. iptables中DNAT、SNAT和MASQUERADE的理解
  7. STM32L5特性简介 Cortex-M33内核TEE-TrustZone信息安全
  8. Facebook 推出新聊天机器人,号称击败谷歌?
  9. .Net页面缓存OutPutCache详解
  10. httpd-2.4.18源码安装
  11. 简历 java技能_java软件工程师简历专业技能填写样本
  12. HCNA培训常见问题001-HCNA AI学习什么内容?
  13. 华住2.0? 5亿万豪用户信息泄漏! 个人隐私如何保护? 离不开区块链
  14. 3.3 测试实现标准的ZIO服务
  15. 数字信号内插方法的python实现
  16. 关于Microsoft Edge 浏览器无法使用selenium调用问题
  17. 怎么在网易云或者QQ音乐上上传自己翻唱的歌
  18. php hook类,基于 CodeIgniter 构建 JWT RESTfull API Server
  19. 不是青蛙就是王子,不是王子就是青蛙
  20. 不是码农,不会敲代码的她,却最懂程序员!| 人物志

热门文章

  1. JSON应用场景与实战
  2. IO库----IO类,文件输入输出,string流
  3. LUOGU P4178 Tree
  4. Beautiful Sequence
  5. hibernate5.0映射配置文件核心配置文件数据更新丢失
  6. C语言-字符数组和字符串
  7. 洛谷OJ P2356 弹珠游戏 维护前缀和
  8. 选择本地照片之后即显示在Img中(客户体验)
  9. [虚拟化/云][全栈demo] 为qemu增加一个PCI的watchdog外设(八)
  10. 探讨下Tag标签的数据库设计(千万级数据量) 转