12月20日,在腾讯2020 Techo Park开发者大会“下一代软硬一体化的云计算基础设施”分论坛上,腾讯云重磅发布星星海首款自研GPU服务器和星星海新一代自研双路服务器,后者也是国内首款搭载即将发布的第三代英特尔至强可扩展处理器(Ice Lake)的双路服务器。此外,腾讯云还分享了在云计算、存储、网络、运维在软硬一体化趋势下的创新和实践。

星星海首款自研GPU服务器,强势占据几宗“最”

会上,腾讯云服务器与供应链管理部总经理刘裕勋表示,随着云计算承载的业务规模越来越大,传统服务器难以完全满足云计算数据中心场景下对超大规模、需求多样、高性价比、安全可靠以及软硬件一体化等方面的要求。通过软硬一体化的不断发展,腾讯云可以结合开发者的多元化需求提供更高性能、更佳性价比的体验。

(腾讯云服务器与供应链管理部总经理刘裕勋)

此次,腾讯云在深入理解业务需求的基础上,重磅推出星星海首款自研GPU服务器。

在云游戏场景中,客户对单卡TCO,单用户成本非常敏感,迫切需要降低成本。但现存所有GPU服务器机箱长度过长,当遇到需要低延时边缘部署时,无法满足需求,会出现单卡挂死,导致整机挂死的情况。

针对类似的场景和业务需求,星星海首款自研GPU服务器在性能、能效、安全特性、可靠性等层面进行了大胆的自主创新和突破。

在设计上,全球首创在同一框架内,灵活更换主板,支持多平台兼容,使得业务在面对GPU 选择时获得非常充分的竞争优势;同时结合业务对PCIe带宽要求低的特点,支持16卡GPU+4路intel服务器,达到业界最高密度,可大幅降低单卡TCO。

在创新上,创业界最短机框,支持边缘部署,提高带宽稳定性,极大降低业务延时(最高可降近百毫秒);在可用性上,这款GPU服务器的RAS特性以及PCIe热插拔特性,使得单GPU故障对整机无影响,可用性大幅度提升。

星星海新一代自研双路服务器,云上建设提前享受技术红利

随着AI、5G、车联网和物联网等技术的大规模部署,企业对于算力、存储等方面的要求也更加苛刻。星星海新一代自研双路服务器是国内首款搭载即将发布的第三代英特尔至强可扩展处理器(Ice Lake)的双路服务器,为用户提供更高内存带宽,更快I/O吞吐,更强实例性能,并帮助用户基于英特尔深度学习加速(英特尔DL Boost)技术,获得处理器内置AI加速能力。

星星海新一代自研双路服务器基于即将发布的第三代英特尔至强可扩展处理器,采用英特尔的10纳米制程,能够满足通用计算、异构计算、裸金属、高性能计算等全业务场景需求。测试数据显示,与搭载第二代英特尔至强处理器的双路服务器相比,新款服务器的浮点性能提高70%,同时单机最高支持的内存可达12TB,可充分满足大型数据库等业务需求。

经测试,星星海新一代自研双路服务器通过深度优化定制,计算密度提升50%;通过高性能散热器和研发创新独立风道设计,散热方案支持CPU功效提升45%;基于增强的可靠性、可用性和可服务性(RAS)技术,可多维度全覆盖故障诊断、精细化定位等问题明确故障,使宕机率减少50%。

面对云业务的需求, 星星海新一代自研双路服务器大幅提升腾讯云计算矩阵战略能力,为用户提供更强的计算性能,实现弹性部署,有效降低云服务总体成本。凭借对硬件系统架构设计和前瞻性基础技术研究,星星海新一代自研双路服务器可以支持未来3-5年的前瞻性架构演变,让云上开发部署提前享受技术红利。

英特尔全球大客户总监米琦表示:“英特尔将基于‘以数据为中心’的全面产品组合、强大合作伙伴生态系统和持续不断的技术创新构筑坚实智慧云基石,一如既往地携手腾讯,共同加速智慧云计算与新基建的发展,拥抱数字经济。”

(英特尔全球大客户总监米琦)

值得一提的是,这两款服务器都是出自星星海硬件实验室,也是腾讯首个硬件工程实验室,该实验室专注于硬件系统架构设计和前瞻性基础技术研究。目前腾讯云星星海已经发布了多款自研硬件产品,包括四款自研服务器和一款智能网卡,并且在计算、存储、网络等全线硬件产品领域申请超过20多项专利。

软硬一体化成趋势,腾讯云打造云计算基础设施

在数据大爆发的时代背景下,云计算承载的业务规模呈现指数级增长,软件和硬件的结合成为刚需。未来,软硬件一体化技术会进一步发展,为用户提供更强壮的基础设施平台,提升云计算的性能、提高资源利用率,最终为用户提供稳定、更具性价比的服务。

此次分论坛上,除了发布两款全新服务器自研硬件产品,在云计算软硬一体化的大趋势下,腾讯云还重点分享了在存储、网络和运维等方面的具体实践,为业界提供了更多的参考。

随着磁存储技术和工艺制程的发展,硬盘容量越来越大,故障率和故障恢复时长也随之变长,这会对云上开发带来很大的稳定性挑战。为了给开发者提供更为稳健的云服务,腾讯云通过对硬盘来料质量,运营监控和技术创新等手段进行智能化运营。

腾讯云服务器运营中心专家工程师牛犇介绍,在来料质量方面,腾讯云采取基于业务模型的来料筛选机制,通过云业务模型与硬盘底层参数建模,分析参数统计分布,定制化筛选标准,使得硬盘年化故障率显著降低至1/5。在运营监控方面,腾讯云的硬盘智能监控系统通过多维度硬盘健康评分和AI 故障预测,可使硬盘故障提前识别率提升至80%。

(腾讯云服务器运营中心专家工程师牛犇)

目前,腾讯数据中心正在运行的服务器超过100万台,经统计,硬件故障导致的系统宕机中,内存故障占比排第一。腾讯云星星海实验室副总监李志高认为,解决数据中心服务器宕机率高的关键路径是降低内存故障率和减少内存故障导致的宕机。

(腾讯云星星海实验室副总监李志高)

腾讯云通过优化算法进行内存筛选、优选X4颗粒内存条、使能多种内存RAS特性等方式大大提升了服务器的可靠性。此外,腾讯云也是业内首家在云计算领域大规模研发部署MCA Recovery技术的云服务商,该技术能够有效缓解不可纠正错误的影响,减少40%以上内存故障导致的宕机。

腾讯云的规模正在飞速发展,云网络内部网关及边界网关带宽性能需求也伴随着腾讯云的规模在快速提升,云网络面临着性能压力、运维压力和可运维性方面的挑战。为此,腾讯云通过可编程芯片硬件的解决方案使得网络带宽提升的同时,成本缩减约为原来的三十分之一。

传统网关升级通过冷升级的方式,依赖上联交换机的hash能力和underlay网络路由收敛时间,而腾讯云可编程芯片硬件解决方案通过单节点热升级的方式,onl控制面把配置按照数据面格式固化在内存存,利用tonfino dma控制器,升级后reload配置,整个热升级过程可以控制在20ms之内。

腾讯云网络产品中心专家工程师陈曦表示,目前该项解决方案已经应用在腾讯云多个高性能的业务场景之中,除了腾讯内部业务大量上云之外,也即将应用在用户idc和本地专有云互通、用户idc数据迁移上云等。

(腾讯云网络产品中心专家工程师陈曦)

而在网络存储虚拟化软硬协同方面,搭配腾讯云自研智能网卡能实现云主机镜像(公有镜像,自定义镜像)全兼容,兼容现有腾讯云云主机各类镜像包括linux和windows。腾讯云容器服务 TKE 借助智能网卡推出下一代容器网络方案。

据腾讯云网络产品中心研发副总监王亮介绍,该方案可无缝的支持和存量的云主机进行相互热迁移,能快速进行云主机和容器服务部署,并且依托软硬件协同实现的高密度弹性网卡,支持一个 Pod 独占一张弹性网卡,不再经过节点网络协议栈(default namespace),极大缩短了容器访问链路,缩短了访问时延,并使 PPS 可以达到整机上限。除此之外,方案还实现了短链接场景下 QPS 相比之前容器网络方案(策略路由方案,网桥方案)提升 50%-70%;长链接场景下 QPS 提升 40%-60%。

(腾讯云网络产品中心研发副总监王亮)

以全新自研服务器产品为核心,围绕网络、存储和运维等细分领域提供多样解决方案,腾讯云正通过软硬一体化的方式,打造面向下一代的云计算基础设施,为各行各业提供更优质的云计算服务,促进全社会的数字化转型升级。

- THE END -

转载请注明出处:快科技

责任编辑:菲尔

腾讯云服务器芯片,腾讯云星星海重磅发布首款自研GPU服务器 占据业界几宗“最”...相关推荐

  1. 寒武纪重磅发布首款AI云芯片,陈天石要让端云结合占领10亿智能终端!

    今天,寒武纪科技放出两个重磅"炸弹": 寒武纪最新一代终端IP产品-Cambricon 1M 寒武纪最新一代云端AI芯片MLU100和板卡产品 寒武纪创始人陈天石介绍,这次最新发布 ...

  2. 龙芯发布首款自主指令系统LoongArch服务器芯片解决方案;宜鼎国际亮相2021年中国国际信息通信展览会 | 全球TMT...

    国内市场 龙芯发布首款自主指令系统LoongArch服务器芯片解决方案.龙芯中科携基于自主指令系统LoongArch打造的通用处理器3A5000.服务器处理器3C5000L及系列产品亮相中关村论坛展览 ...

  3. 腾讯云推出首款自研服务器星星海;苹果新款Mac Pro整套配齐超30万;Fedora 31稳定版发布|极客头条...

    快来收听极客头条音频版吧,智能播报由标贝科技提供技术支持. 「CSDN 极客头条」,是从 CSDN 网站延伸至官方微信公众号的特别栏目,专注于一天业界事报道.风里雨里,我们将每天为朋友们,播报最新鲜有 ...

  4. 10月30日科技资讯|腾讯云推出首款自研服务器星星海;苹果新款Mac Pro整套配齐超30万;Fedora 31稳定版发布|极客头条

    「CSDN 极客头条」,是从 CSDN 网站延伸至官方微信公众号的特别栏目,专注于一天业界事报道.风里雨里,我们将每天为朋友们,播报最新鲜有料的新闻资讯,让所有技术人,时刻紧跟业界潮流. 整理 | 郭 ...

  5. 腾讯云首款自研星星海服务器云上应用规模增长已超30倍

    腾讯云首款自研星星海服务器云上应用规模增长已超30倍 2020年9月30日,腾讯云对外披露,公司首款自研星星海服务器在云上的应用规模增长已经超过30倍,客户规模增长超过50倍,成为业内上线后规模增长最 ...

  6. 腾讯云推出首款自研H265硬件编码器瑶池,助力云游戏降低15%带宽

    10月29日,腾讯云宣布正式推出H265硬件编码器瑶池V500.据了解,作为腾讯云首款自研H265硬件编码器,瑶池V500能充分满足云游戏低时延高吞吐的需求,在同等画质情况下,可以实现带宽占用降低15 ...

  7. 阿里巴巴旗下半导体公司平头哥重磅发布了公司自研的云芯片

    在云栖大会上,阿里巴巴旗下半导体公司平头哥重磅发布了公司自研的云芯片-倚天710.备受期待的阿里巴巴自研服务器芯片终亮相. 阿里云智能总裁.达摩院院长张建锋表示:「基于阿里云『一云多芯』和『做深基础』 ...

  8. 腾讯首款自研MMOG--QQ幻想网络同步算法揭秘

    from: http://djt.qq.com/bbs/article-292-1.html 腾讯首款自研MMOG--QQ幻想网络同步算法揭秘 概述 游戏发展从单机游戏到局域网游戏再到mmog(Mas ...

  9. 阿里云发布首款云电脑“无影”,价格仅传统电脑的一半

    阿里云发布首款云电脑"无影",价格仅传统电脑的一半 作为一家致力于通过应用现代科学技术谋求发展的企业,阿里巴巴已然成为了我国国产企业中的一大王牌,对外代表着中国企业的最佳想象. 热 ...

  10. 互联网日报 | 苹果首款自研芯片M1亮相;酷派主动终止与小米专利侵权诉讼;橙心优选日订单破700万...

    今日看点 ✦ 滴滴旗下橙心优选日订单突破700万,领跑社区电商行业 ✦ 酷派主动终止与小米专利侵权诉讼,推动行业进步是首要任务 ✦ 恒大汽车正式发布恒驰车标,寓意"东方雄狮,傲视全球&quo ...

最新文章

  1. 资源 | 李飞飞、吴恩达、Bengio等人的15大顶级深度学习课程,你收集全了吗?
  2. 英伟达副总裁:生物医疗将是与 AI 结合最紧密的行业之一
  3. 那些常见的C++、Qt基础面试题
  4. 【Jetson Nano学习笔记】4. python 3编译bridge
  5. 51nod 1379 索函数
  6. CBOW模型的数据预处理
  7. 数据驱动创新 融合引领变革 2017中国工业大数据大会·钱塘峰会今日在杭州国际博览中心顺利举行...
  8. 小D课堂-SpringBoot 2.x微信支付在线教育网站项目实战_3-5.PageHelper分页插件使用
  9. mysql匿名账户登录导致的ERROR 1044 (42000): Access denied for user ''@'localhost' to database 'mysql'错误...
  10. android游戏手柄开发,android游戏手柄开发测试代码
  11. 统一建模语言 UML
  12. 用python的requests第三方模块抓取王者荣耀所有英雄的皮肤
  13. 大学物理实验(二)气体比热容比的测定
  14. java网络爬虫如何控制爬取的深度_Java 动手写爬虫: 二、 深度爬取
  15. STM32-F407入门学习专题(九) STM32外设之ADC
  16. 十个优质编程网站,程序员们赶紧看过来!
  17. MATLAB数字图像水印
  18. CX32l003 点亮0.96寸OLED屏幕
  19. 2015-10-16 Invoke 函数 InvokeRepeating函数 CancelInvoke取消Invoke函数
  20. 同花顺概念板块成分股数据分享

热门文章

  1. 3.5.3 连接偏移量管理器
  2. 笔记本电脑没有外放声音,但是插上耳机有声音的问题解决方法
  3. JS 中提交表单Form方法
  4. sql server 无法为该请求检索数据
  5. 玩转华为ENSP模拟器系列 | 配置OSPF ABR路由聚合示例
  6. Alibaba微服务组件Nacos单机+集群配置 prometheus+grafana监控配置及注册中心实战【收获满满】
  7. 计算机视觉和模式识别领域企业论坛,第三届中国模式识别与计算机视觉大会(PRCV 2020)圆满举办...
  8. 物联网安全硬件修改系列-硬改
  9. 桩身弹性压缩计算公式_桩身弹性压缩量计算
  10. 肩周炎的治疗方法哪个最有效