本文作者宗志刚(花名瑄珉),网络领域从业十五余年,现任阿里云网络产品线资深技术专家,负责阿里云网络洛神平台的技术规划、架构设计以及网元产品研发工作。在刚刚过去的云栖大会上,宗志刚做了“洛神3.0:应用-云-边-端一体的新一代云网络平台”的主题分享,详细阐释了阿里云新一代洛神云网络平台的技术架构升级。本文根据作者的演讲内容整理而成。

云网络发展历程

云网络1.0时代,主要实现数据中心云化后的多租户隔离的网络,它的技术特点就是在云上Region内实现了大规模的overlay网络。

随着企业上云的步伐加快,越来越多的企业上云,特别是大型、超大型企业上云,因为全球服务的要求,云网络不仅要支持数据中心内部的网络,还要支持多个数据中心的全球互联,同时云上/云间的流量激增,企业的业务也丰富多样。

这个阶段的网络,我们称为云网络2.0时代。在技术上,支持跨域网络的虚拟化,同时为了提供性能更高、灵活性更好的网络,软硬件一体化、云原生方式的弹性架构,开始规模化应用在云网络中。

从2020年开始,云网络产品和技术逐步走向边缘和应用,支撑5G/IoT应用的上云,我们定义为云网络3.0时代。

洛神:飞天云操作系统的内核组件

阿里云网络产品技术平台叫洛神,它是阿里云飞天操作系统的内核组件之一,负责网络的虚拟化,与计算虚拟化平台神龙、存储虚拟化平台盘古以及物理资源管理平台天基共同组成了飞天的内核基础,并向上支撑构建了阿里云丰富的IaaS、PaaS产品。

洛神平台总体架构:SDN+NFV
洛神·云网络平台的总体技术架构,是一个非常典型的SDN+NFV架构,最底部是物理网络基础设备,提供网络最基础的连通能力;

向上是转发面,洛神平台使用多种类型的资源来进行数据面的转发,例如传统的x86裸金属服务器,国产化ARM CPU,还有目前已经规模应用的可编程芯片;

在转发数据面之上,构建了一个NFV平台,叫CyberStar平台,用于管理底层不同的转发资源,提供统一抽象的能力,例如弹性资源扩缩容能力,资源异构屏蔽能力等,提升上层业务网元的研发效率;在此之上,是业务网元自身的转发逻辑。

在控制面,洛神平台使用集中式的SDN控制器,实现各网元的业务编排。另外,为了保障整个网络的高效运维和运营,洛神平台还构建了一个智能运维分析平台,内部叫做齐天平台,依靠大数据驱动,实现网络的智能运维和运营。

当前在网运行的阿里云网络规模部署的是洛神2.0平台,简单来说,它是一个三位一体网络:

首先,云网一体:主要是阿里云网络资源的覆盖已经全球化,目前已经有24个Region,75个可用区,280+个POP接入节点;

其次,软硬一体:主要体现在数据面,使用FPGA以及可编程芯片方式,极大提升了数据面转发性能,其中VPC网关单台可达到3.2T,不仅满足超大类型客户的转发性能需求,还可以提升大象流的吞吐,提升网络的可靠性;

最后,伸缩一体:阿里云网络的应用网元,基于洛神CyberStar NFV平台,可以实现阿里云网元任意规格分钟级的弹性。

洛神3.0,构筑应用-云-边-端一体的智能云网络

从2020年开始,我们启动洛神3.0的研发,其关键的场景是应用-云-边-端一体化的智能化网络。网络最核心的价值是连接——连接应用,连接端,连接不同地域不同类型的网络;应用-云-边-端一体的连接场景,我们总结成三种主要连接方式:

广泛的连接:从过去的云网络以云为中心,走向连接更加广阔的区域,连接边缘,连接IoT端,把中心云和本地云、边缘云结合起来。

深入的连接:这是网络在纵向的连接,要满足应用不同场景(包括应用与应用之间)的连接,特别是生态服务部署到云上之后的连接。

极简的连接:网络是一个分布式系统,本身是极端复杂的,但是应用以及IT运维人员希望看到一个简单的网络。

应用-云-边-端一体化的场景,对云网络的技术提出了更高的要求,总结下来,包括如下几个方面:

更高性能的网络管理能力:因为网络的边界大大扩宽,网络的节点海量增加,链路的环境也发生了很大的变化,但体验要求没有降低,所以对网络的管理能力提出了更高的要求。

**更灵活的网络转发设备:**因为地域不一样,特别是边缘场景,环境差异巨大,如何适应不同场景转发需求,需要网络转发设备更加灵活。

**更简易的网络互联协议:**网络互联要简单,应用关心的是业务逻辑,在云上应用与其它应用或者端连接时,如果太复杂,是无法规模化应用的。

**更智能的网络维护技术:**网络的边界在扩大,与应用的连接更加紧密,覆盖面更广;网络的维护工作量和复杂度急剧增加,网络的维护压力也大大增加,需要使用更加智能的网络维护技术,减少网络的运维&运营投入。

针对云网络3.0时代的应用场景对技术的要求,洛神3.0开启了相关技术的研发,也取得了一些阶段性成果:

云边端一体,极致性能的网络控制器

云边端一体,中心云延伸到边缘,包括客户的IDC;为了提升体验以及统一运维,需要VPC从中心延伸到边缘,而不是独立的数据中心,这就要求网络的管控系统依然是统一的,但是管理系统管理的网络范围和实例数会大大增加,管理链路的环境也会增加很多复杂度,在此种环境下,洛神平台的管控系统进行了开发,其中最重要的变化是我们统一的各种网关的南向,采用新的内存数据库抽象网关不同对象之间的关系,做到联动下发,批量下发,来提升管控的处理性能,支持例如单VPC千万实例,亿级配置,每秒千条路由刷新的能力。

云边端一体,多功能融合的网关设备

在数据面,边缘的场景非常多样化,因此造成了一定的复杂度,但有一个共性,就是空间有限,对成本敏感,但功能特性一个都不能少,流量模型还具有多样性。在这个点上,洛神云网络平台对VPC网关设备做了融合处理,这里的融合不仅是简单的部署在一台物理设备中,底层的转发资源也做了池化,以便及时应对不同资源模型,同时也要保证架构上的解耦,与中心云的网关架构保持一致。

面向应用生态的连接技术

上面主要是网络连接广度方面的一些技术,在纵向深度上,简化应用的连接,我们提升了阿里云洛神CyberStar平台的能力,将服务链的能力集成到平台中,这样基于CyberStar平台的网元之间可以非常简单地实现连接,例如最近在公测的NAT FW产品,用户不需要配置任何路由,只需要勾选集成的产品选项,就可以实现NAT和FW之间的自动引流,大大简化了应用的连接复杂度。

大数据驱动的智能运维分析
最后,网络连接得更广、更深,网络的边界在扩大,网络运维运营的复杂度也会大大提升,网络的控制面是针对单网元的,是一个垂直化的部件,但是网络是一张网,需要全局视角,例如某个网元转发流量下跌,到底是自身问题还是底层vswitch问题,还是EIP问题;例如版本发布变更,业务是否全部恢复,都需要全局视角。

针对这些场景,洛神平台升级了齐天大数据智能分析系统,齐天系统已经开发并稳定运行了数年,之前更多是内部使用,保证整个洛神云网络的平稳运行,为我们对外提供的云网络产品和服务保驾护航;洛神3.0开始,我们也推出了产品化服务——NIS网络智能服务,采用与齐天大数据系统相同的架构。

齐天大数据分析平台

这是齐天大数据平台的总体架构,相关监控数据会采集到数据中台层,进行数据格式的标准化,统一数据访问接口,最终由云网络智能算法平台使用相关的算法模型对这些数据进行清洗、分析,得到关于异常的检测、关联、根因的定位以及网络优化信息,并通过API传输给网络运维工程师和云上的用户。

总结

阿里云网络洛神平台正走向云网络3.0时代,开启面向应用-云-边-端一体化的技术升级和探索。对于网络的横向延伸,会拓展网络的边界,云-边-端在网络侧融合。网络的纵向延伸,更加紧密集合应用和生态,同时采用智能化的方法,加速网络智能化的管理,并将智能的能力输送给云上用户,让网络更简单。

洛神3.0来了!阿里云资深专家起底云网络平台的技术架构升级之路

阿里云资深专家起底云网络平台的技术架构升级之路-洛神3.0相关推荐

  1. 阿里云资深专家李国强:云原生的一些趋势和新方向

    作者:阿里云用户组 2021 年 11 月 26 日,阿里云用户组(AUG)第 3 期活动在广州顺利举行.具有丰富的容器.微服务等领域经验的阿里云云原生资深专家李国强,向现场数十家广州企业分享了云原生 ...

  2. 全球边缘计算大会:阿里云资深技术专家李克畅谈边缘计算的技术趋势与挑战

    2020年11月7日,以"5G·边缘计算"为主题的全球边缘计算大会在北京新世界大酒店成功召开,作为业内首个专门为边缘计算人打造的行业盛会,此次活动现场共有超过600+来自政.产.学 ...

  3. 一群阿里人如何用 10 年自研洛神云网络平台?技术架构演进全揭秘!

    [CSDN 编者按]逍遥子曾说,对阿里人来说「打仗是最好的团建,参加过双 11 的叫战友」,同样,参加过多次双 11 考验的系统技术都会成为真正意义上的基础设施,阿里云飞天系统的云网络平台洛神就是如此 ...

  4. 腾讯云TVP专家眼中的云开发:尚不完美,未来可期

    引言 C++之父 Bjarne曾说,"世界上只有两种编程语言,一种被人骂,一种没人用".这句玩笑话道出了软件开发行业的真谛,不怕被人吐槽,就怕没人吐槽.如果以今天的眼光去审视那些成 ...

  5. UPYUN CTO 黄慧攀:云 CDN 的技术架构演进之路

    传统的 CDN 从 2000 年诞生起,一直到 2010 年都还停留在一个阶段,技术并没有得到很大的提升,有的还是 Squid ,一般在全国有 30 – 40 个节点.因为在早几年移动还没发展起来,电 ...

  6. 独家解读!阿里首次披露自研飞天大数据平台技术架构

    9 月 26 日,阿里云飞天大数据平台在云栖大会第二天主论坛上正式对外发布,这也是阿里首次对外披露飞天大数据平台的整体架构. 据介绍,飞天大数据平台由阿里自主研发,可扩展至 10 万台计算集群,是目前 ...

  7. 阿里云数据库专家于巍荣获PostgreSQL中国技术大会“最具价值专家 MVP”奖

    2023年3月3日,在由PostgreSQL中文社区主办的"第十二届PostgreSQL中国技术大会"上,阿里云数据库开源首席架构师于巍荣获"中国 PostgreSQL ...

  8. 云享专家倪升武:微服务架构盛行的时代,你需要了解点 Spring Boot

    [摘要] 微服务架构的本质在于分布式.去中心化. 随着互联网的高速发展,庞大的用户群体和快速的需求变化已经成为了传统架构的痛点. 在这种情况下,如何从系统架构的角度出发,构建出灵活.易扩展的系统来快速 ...

  9. UPYUN的云CDN技术架构演进之路

    传统 CDN 自 2000 年诞生起,一直到 2010 年还都处在同一个发展阶段,技术并没有得到很大的提升.其中很多还使用 Squid ,一般在全国有 30 – 40 个左右的节点.前几年,移动互联网 ...

  10. 阿里云边缘云荣获“分布式云创新奖”与“先进边缘云架构奖”

    简介:4月7日,2021年全球分布式云大会在北京隆重召开.阿里云凭借在商业创新.技术实力.产品服务等多方面领先优势,荣获"分布式云创新奖"和"先进边缘云架构奖" ...

最新文章

  1. [学习笔记]CDQ分治
  2. 菜鸟的 Sass 学习笔记
  3. VMware系列:将物理机热迁移到ESXi中(必藏喔)
  4. 052、overlay如何实现跨主机通信?(2019-03-19 周二)
  5. DP 转移方程 —— 单调队列优化 斜率优化 李超树优化
  6. 能ping通,TCP就一定能连通吗?
  7. c语言中 cos函数图像,cos图像(cos函数的图像)
  8. 区块链大咖谈之陈昌:联盟链和公有链混合架构如何实现?
  9. Word章节自动编号+公式编号
  10. 实现百度地图marker平滑移动
  11. 全面解读“数字孪生”
  12. 微型计算机主装箱中装有哪些,微型计算机及接口技术2016年10月真题试题(04732)...
  13. Facebook全球争夺工智能人才,看上了中国高校
  14. 面试:GET 请求能上传图片吗,已解决
  15. 【探花交友】day05—圈子互动
  16. 2021年焦作市一中高考成绩查询,2021年焦作高考状元名单公布,焦作文理科状元是谁多少分...
  17. 用Python写了一个贪吃蛇大冒险小游戏
  18. 黑龙江东方学院18级计算机名单,黑龙江东方学院学生社团联合会2017年干事纳新名单公示...
  19. 通过设置CSS属性来实现鼠标悬浮放大或缩小区域
  20. UE4 HLSL Tools For Visual Studio插件(包含.ush ,.usf 如何语法高亮)

热门文章

  1. cocoapods 总结
  2. Mongoose学习参考文档
  3. 策略模式(Strategy)、枚举策略模式
  4. asp远程访问sql server数据库
  5. Google卫片下载(转)
  6. Linux启动时 Error 15: File not found 问题解决方法
  7. Disruptor学习笔记
  8. 将xml文件由格式化变为压缩字符串
  9. 一句话讲清楚什么是JavaEE
  10. 12_通过上下文操作私有目录模式说明