计算-互连-数据

一颗芯片,寄存器通过总线向运算器输送数据。一台服务器,内存通过DDR总线与处理器完成数据互动。一个数据中心,存储集群通过以太网与计算集群形成对数据流的处理和加工。互连是算力与数据的纽带,从芯片内部到数据中心,都能很好地诠释这一基本体系组合。由此展开对服务器体系架构的遐想,在这个注重高效计算和存储的时代,实现多元化系统资源的敏捷交付:端到端的解耦型部件资源,借助于高性能的可定义互连,按需组装并柔性交付服务器,具备裸机性能,却提供更灵活的生命周期管理效率。

GONGGA系统架构

GONGGA系统正是我们面向这一理念的全面实践,让服务器配置具备”可编程”的原力。科技演进步伐持续突飞猛进,芯片架构与工艺的迭代,物理颗粒的升级与创新,总线协议的优化与革命, 推动着供给侧的多样性。同时人工智能/云计算/IoT等业务的崛起,业务性能与配置配比需求的差异化诉求则是刚需。

如何做到内外融合的发展,具有腾讯基因的GONGGA服务器正是基于这样的思考,开启了对未来的一次探索:统一系统形态,灵活资源配置。2U规格的系统规格,在腾讯基础架构中拥有最好的适配性。小小的机箱内,不再有CPU/内存等传统计算单元,取而代之的是高速PCIe 互连芯片,通过PCIe内部互连拓扑,实现PCIe设备与传统CPU计算资源的解耦合。基于PCIe互连拓扑,通过管理芯片实现PCIe资源的重构。这样就实现了业务端在源扩充的精准匹配,可以更深层次的针对业务进行资源调整,为智能分配提供基础。通过对传统资源的解耦和重构, 依托腾讯自动化运营平台, 满足业务部门的动态需求。

高性能存储

系统前窗(位置1)可以配置了多种模块化结构,可以容纳24块U.2 NVMe盘或者32条Ruler
SSD,单盘30TB的存储容量,让单系统提供了多达1PB的高性能存储密度。通过GONGGA系统内置的PCIe交换芯片,就可以开启基于裸盘存储的共享经济初级模式。多用户按需对物理盘位进行切分使用,属于PCIe直挂形态,硬件性能无损。后期设计升级后可以基于SR-IOV进行更加精细化的空间划分和管理。例如,当现有系统需要存储升级或扩容时,用户可以在现有核心系统增加一块PCIe扩展卡,无须更换新服务系统,即可实现升级和扩容,避免大量数据迁移,并提高现有系统的使用有效性。

在后窗配置全高全长NVMeoF板卡, 那就是块设备输出的共享进阶模式。多张NVMeoF板卡南向连接NVMe设备,北向提供100GbE网络带宽,以NVMeoF协议对外提块设备服务,PCIe交换芯片内建板卡间通信链路,在未来能提供额外的硬件冗余扩展功能。通过这样形态的组合,结合应用层的资源调度和负载均衡,就可以实现类似于AWS EBS的网络块设备服务了。NVMeoF板卡上的ARMv8拥有强大的处理能力,也支持相关二次开发,满足自有协议的实现和优化。

AI

在AI in All的时代,GONGGA系统可以支持的部件中少不了各类计算加速硬件。从Training导向的全高全长规格GPU,多形态的Inference加速卡,到通用FPGA板卡,都可以量化支持。主流训练GPU系统以一机8卡为主,使用GONGGA系统可以实现更灵活的扩展。4台GONGGA系统组装为拥有16卡计算的加速系统,GPU与处理器之间的带宽可通过接线形式自由配置,还能支持一系列提升训练效率的功能:GPUDirect
RDMA,GPU之间的P2P通信等。

当前窗装满24块U.2形态的Inference加速卡,可以想象一下基于单机的图片/语音/文本等数据处理能力了。GONGGA系统又融合了通用计算的支持能力,可容纳8张单路高主频x86微服务器刀片,满足基于游戏和Web服务器等定向应用的诉求。

面向未来的互连理念

面向各类异构设备互连的解耦与融合,是GONGGA系统的基本设计思想。从1.0版本的PCIe互连开始,Gen-Z/OpenCAPI/CCIX等互连技术在业界蓬勃发展,需要我们深入探索和参与,结合腾讯运营理念,拥抱开放,
逐步迭代。

总结

以上是对系统设计和功能场景的介绍,我们也需要对GONGGA系统带来的价值来进行分析比对。对于AI应用4U8卡形态的训练机型,2台GONGGA系统加上一台通用服务器作为机头可以满足同等功能,由于采用了自主研发模式,保证成本透明度,比同期采购的4U8卡机型在L6级别显著降低。针对NVMe块设备系统,以2台2路服务器并各配16块NVMe盘为参照,1台GONGGA系统可以配置32块Ruler-SSD和内置2块单路系统机头,以1:16形式提供相同块设备服务,而且具备机头间互备的硬件能力,降低系统总成本的同时, 也实现机架位的隐性扩容。还有其他扩容和升级项目,面向硬件的连接方式,减少了数据迁移和整体升级的代价,可以有效提升存量服务器的使用率,不作一一展开讨论了。

总结GONGGA系统的核心能力:1、面向多种硬件资源的解耦和重构能力;2、通用服务器形态下非凡的资源兼容和可视化能力;3、面对应用层完全透明的多种互联技术;4、依托于腾讯高度自动化运维平台的智能管理能力。仰望星空,励志前行,We’re heading for GONGGA!

弹性服务器架构-连接一切的力量相关推荐

  1. Web服务器处理连接请求的四种架构方式

    1.单线程web服务器       此种架构方式中,web服务器一次处理一个请求,结束后读取并处理下一个请求.在某请求处理过程中,其它所有的请求将被忽略,因此,在并发请求较多的场景中将会出现严重的必能 ...

  2. 常见的服务器架构入门:从单体架构、EAI 到 SOA 再到微服务和 ServiceMesh

    前言:架构的演变流程 单体架构 ==> 垂直架构 ==> 前后端分离 ==> EAI架构  ==> SOA架构 ==> 微服务 ==> 微服务2.0 1.单体架构: ...

  3. 使用Nomad构建弹性基础架构: 容错和中断恢复

    这是Nomad构建弹性基础架构系列文章的第四篇也是最后一篇(第1部分,第2部分,第3部分).在本系列文章中,我们将探讨Nomad如何处理意外故障.停机和集群基础设施的常规维护,通常不需要操作员干预. ...

  4. 如何设计大型游戏服务器架构?

    一.游戏服务器特征 游戏服务器,是一个会长期运行程序,并且它还要服务于多个不定时,不定点的网络请求.所以这类服务的特点是要特别关注稳定性和性能.这类程序如果需要多个协作来提高承载能力,则还要关注部署和 ...

  5. 虚拟机和实体服务器怎样连接,服务器实体机与虚拟机

    服务器实体机与虚拟机 内容精选 换一换 GaussDB(DWS) 提供的gsql命令行客户端,它的运行环境是Linux操作系统,在使用gsql客户端远程连接GaussDB(DWS) 集群之前,需要准备 ...

  6. 双服务器架构实战飞桨部署-自动上色和老相片修复

    双服务器架构实战飞桨部署-自动上色和老相片修复 宋 朱熹 <即事有怀寄彦辅仲宗二兄>诗之二:"闻说双飞桨,翩然下广津. 飞桨功能强大,部署非常简单方便(对我这个不熟练的人,并不是 ...

  7. 手机游戏服务器都是什么协议,手机网游的服务器架构

    在今日(3月15日)于国家会议中心举办的"2014CocoaChina春季开发者大会"上,UCloud高级架构师韩新亮分享了网络游戏的服务器架构问题,以及他认为的优秀游戏架构的特征 ...

  8. 大型游戏服务器架构该怎么设计?

    一.游戏服务器特征 游戏服务器,是一个会长期运行程序,并且它还要服务于多个不定时,不定点的网络请求.所以这类服务的特点是要特别关注稳定性和性能.这类程序如果需要多个协作来提高承载能力,则还要关注部署和 ...

  9. Serverless无服务器架构详解

    本文对Serverless架构的基础概念,具体产品,应用场景,工作原理进行详细解析. 基础概念 Serverless: 无服务器架构,即在无需管理服务器等底层资源的情况下完成应用的开发和运行,是云原生 ...

最新文章

  1. 每天一个linux命令(12):more命令
  2. Cracer渗透视频课程学习笔记——漏洞分析
  3. 国内首次 Istio Meetup 来了,主流社区专家邀你来共聊
  4. 用计算机弹奏hop,关于职称计算机Photohop模拟练习题参考
  5. 15款提高工作效率的工具分享
  6. 在Java 8 Lambda中创建自己的循环结构
  7. 环形链表||(Leetcode第142题)
  8. docker 镜像 增删改查
  9. Hive配置文件中配置项的含义详解(收藏版)
  10. CentosOS 7: 创建Nginx+Https网站
  11. 使用DOM4J解析大容量XML文件
  12. ResNet网络模型
  13. 书评:我看《软件开发沉思录ThoughtWorks文集》
  14. Erlang学习时间曲线
  15. 解压压缩包的时候要求输入密码
  16. learn git branching
  17. 计算机处理器份额,处理器市场份额排名 英特尔X86架构继续领先
  18. DUTOJ-1205: 对圣杯宝具的威力值
  19. 人体行为识别研究综述
  20. linux环境下抓包

热门文章

  1. STC12单片机串口U盘测试程序源码
  2. nagios nrpe
  3. harris角点检测的学习
  4. 将计算机退出域 脚本
  5. 一般处理程序制作的验证码
  6. Linux网卡配置(二)网卡配置命令
  7. CodeForces - 1096D Easy Problem(线性dp)
  8. 高精度运算模板(大数模板)
  9. HDU - 4725 The Shortest Path in Nya Graph(最短路+思维)
  10. 0100-Same Tree(相同的树)