「无论性能还是能效,安培架构GPU都是图灵的两倍,」黄仁勋于今日凌晨的RTX 30系列线上发布会坦言。「从架构、定制流程设计、电路、逻辑、封装、series IO、显存、供电、散热、软件和算法…… 我们在所有层面压榨GPU的性能,最终实现了世界领先水平。」

GeForce RTX 3080 丨 第二代RTX 丨 强者致胜

今天,距离英伟达发布世界首款GPU、也是第一款以Geforce为名的显示核心——Geforce 256已经21年了。21年来,GPU彻底改变了现代计算机图形学。如今,采用NVIDIA Ampere架构的GeForce RTX 30系列GPU再次走出迈向未来的一大步。

前所未有的性能飞跃,最强旗舰级GPU问世

NVIDIA最先进的技术和二十多年的图形研发成果,使NVIDIA RTX集可编程着色、光线追踪和人工智能于一身,为全新GeForce RTX 30系列GPU和NVIDIA Ampere架构带来惊人性能,将助力开发者打造新世界。

技术突破详情:

  • 全新的流式多处理器:全球速度最快、效率最高的GPU部件,其处理能力为30 Shader-TFLOP/s, 并且FP32吞吐量是上一代产品的2倍

  • 第二代RT Cores:全新专用RT Core计算能力为58 RT-TFLOPS,是上一代的2倍,同时支持光线追踪、着色与计算。

  • 第三代Tensor Cores:全新专用Tensor Core吞吐量是上一代的2倍,能够更快速、更高效地运行AI驱动的技术,如NVIDIA DLSS,算力高达238 Tensor-TFLOPS。

  • NVIDIA RTX IO:实现基于GPU的快速加载和游戏资源解压,与硬盘和传统存储API相比,输入/输出性能最高可加速100倍。结合微软全新Windows版 DirectStorage API,RTX IO将几十个CPU核心的工作转移到RTX GPU上,提高帧率,并实现近乎瞬时的游戏加载。

  • 全球最快显存:NVIDIA与镁光合作,为RTX 30系列打造全球最快的GDDR6X显存,为显卡应用提供接近1TB/s的数据传输速度,最大限度地提升游戏和应用性能。

  • 新一代工艺技术:来自三星的全新8nm NVIDIA定制工艺,可实现更高的晶体管密度和更高的效率。

总体来说,GeForce RTX 30系列确实占据了GPU界的多项「第一」:首款有着24GB  GDDR6X显存的消费级图形卡;首批支持 HDMI 2.1的GPU,一块显卡即可实现4k高刷新率或8k游戏;首批支持AV1编译码器的独立GPU,实现以更少的带宽观看更高分辨率的视频流。

RTX 30系列具体参数

GeForce RTX 3080:建议零售价¥5,499起,预计9月17日起售。GeForce RTX 3080内建8704 个CUDA,比GeForce RTX 2080快2倍。GeForce RTX 3080 拥有10GB的全新高速GDDR6X显存,运行速度高达19Gbps,在4K分辨率下带来每秒60帧稳定的游戏体验。

GeForce RTX 3070:建议零售价¥3,899起,预计9月24日起售GeForce RTX 3070 售价仅为GeForce RTX 2080 Ti的一半不到,比GeForce RTX 2070快60%。它配备8GB GDDR6显存,有5888 个CUDA,相比之下,2080Ti的CUDA核心是4300个,所以3070性能超过 2080Ti,看来是没什么问题的。

GeForce RTX 3090:建议零售价¥11,999起,预计10月起售。GeForce RTX 3090 被称为 "性能猛兽"。它配备有一个三槽双轴,流线型设计的散热器,比TITAN RTX安静10倍,并且极致冷静,可降低GPU保持温度最高达30℃。它的24GB GDDR6X显存可以应对最具挑战性的人工智能算法,并满足大规模内容创作的需求。GeForce RTX 3090比TITAN RTX快50%,在8K分辨率下让玩家能在众多顶级游戏中达到60fps。

AI算力性能前瞻

RTX 30系列采用的都是今年 5 月刚刚推出的最新7纳米制程架构安培(Ampere),其首先被 Tesla A100所采用。RTX 3090的24G内存和1399美元的价格或许能够让很多对深度学习有需求的用户省下买泰坦的预算。

针对稀疏矩阵的加速可以让安培架构GPU处理AI任务的效率提高一倍

安培架构还有一些针对AI计算特有的机制,其中的三代Tensor Core会对稀疏张量运算进行特别加速:执行速度提高一倍,也支持TF32、FP16、BFLOAT16、INT8和INT4等精度的加速—系统会自动将数据转为TF32格式加速运算,现在你无需修改任何代码量化了,直接自动训练即可。

不过由于消费级和专业级芯片的结构不尽相同,我们不能把 Ampere A100 芯片的AI训练性能简单地直接拿来作为参考,还需要等待官方公布,以及最终实测的数据。

黄仁勋表示,GeForce RTX 30 系列显卡具备三项基础处理技术:30TFLOPS 算力的可编程着色器(Turing架构是11),双倍吞吐量,用于光追的RT Core(58 RT TFLOPS,Turing架构是34),以及可自动忽略次要DNN权重的Tensor Core(238Tensor TFLOPS,旧版为 89)。

三个方面,性能相比前一代都是翻倍。

宽泛科技携手NVIDIA,共筑澎湃AI算力新基建  

宽泛科技作为英特尔、英伟达等芯片及品牌厂商的坚实合作伙伴,NVIDIA潜力AI公司加速计划成员,携手专注为人工智能提供硬件解决方案及相关服务,已成为国内过万家企业、院校及研究机构的信息化解决方案供应商。

旗下Cloudhin®云轩支持Deep learning和高性能计算服务器定制,针对主要深度学习框架(如TensorFlow、Caffe 2、Theano或Torch)进行了优化和设置,为计算系统提供强大的深度学习功能。

NVIDIA Tesla A100(PCIE版)、RTX 30系列深度学习服务器现已开启预约定制服务,A100由NVIDIA Ampere优化软件提供支持:包括CUDA 11;50多个CUDA-X™库的新版本;多模式对话式AI服务框架NVIDIA Jarvis;深度推荐应用框架NVIDIA Merlin;RAPIDS™开源数据科学软件库套件;NVIDIA HPC SDK,其中内含编译器、库和软件工具,可最大程度地提高开发者的工作效率以及HPC应用的性能和可移植性。

凭借这些功能强大的软件工具,开发者们能够构建并加速HPC、基因组学、5G、数据科学、机器人学、深度学习等领域的应用。

专业勤修,锐意进取。云轩技术工程师毕业于NVIDIA深度学习研究所,丰富经验,值得信赖。更多定制方案请联系客服,我们将实时响应您的定制需求。

联系我们

如果您有合作需求或宝贵建议,欢迎来信。

邮箱:hezuo@kuanfans.com

合作热线:400-610-1360转375899

RTX 30系列性能≥2倍图灵GPU!AI算力前瞻,性价比超泰坦相关推荐

  1. “半价买2080Ti”,英伟达发布RTX 30系列显卡,性能翻倍价格更低,网友高呼“NVIDIA YES”...

    晓查 贾浩楠 发自 凹非寺 量子位 报道 | 公众号 QbitAI 千呼万唤始出来!游戏玩家等待了2年的英伟达新显(he)卡(dan)终于来了,而且加量又减价. 今天,黄仁勋在自家厨房里正式发布新一代 ...

  2. GeForce RTX 30系列GPU实现NVIDIA史上前所未有的性能飞跃

    采用NVIDIA Ampere架构,第二代RTX为实时光线追踪和AI游戏带来2倍于Turing GPU的性能提升 加州-圣克拉拉市, 2020年9月1日--今天,NVIDIA 发布采用 NVIDIA ...

  3. linux英伟达显卡内核不匹配,Linux 5.11 内核将添加对英伟达 RTX 30 系列显卡的支持...

    IT之家1月16日消息 尽管 Linux 5.11 内核即将于 2 月初发布,但 Linux 创始人 Linus Torvalds 表示,已经决定将英伟达 RTX 30 系列 Ampere 显卡新发布 ...

  4. 英伟达RTX 30系列卖得太好,财报业绩创新高,老黄:Arm收购完成时间已确定

    杨净 发自 凹非寺 量子位 报道 | 公众号 QbitAI 教主黄仁勋,最新心情应该很不错. 因为业绩很不错.北京时间11月19日凌晨,英伟达公布了2021财年第三季度财报. 第三季度营收47.26亿 ...

  5. 关于使用pytorch在30系列显卡(高级别显卡)算力不够问题

    问题 在后台搭建docker镜像环境时,在10.20系列卡上兼容常见版本的pytorch.搭建环境时在dockerhub.nvidia官网随便拉取镜像基本都能使用.但把镜像迁移到30系列卡时就会有算力 ...

  6. 双显卡单独分辨率_CPU、GPU双重碾压!AMD RX 6000系列显卡正式发布 16G显存吊锤RTX 30...

    期待已久的AMD新一代显卡终于发布了,全新Radeon RX 6000系列显卡正式登场,首批包括RX 6800.RX 6800 XT.RX 6900 XT三款型号,均基于RDNA 2架构.Navi 2 ...

  7. RTX 30系游戏本来了!1月26日开售,售价999美元起

    贾浩楠 发自 凹非寺 量子位 报道 | 公众号 QbitAI RTX30系列的GPU也杀到笔记本上了! 今天凌晨,英伟达在CES 2021展会上正式推出适配笔记本的RTX 30系列移动显卡,包括RTX ...

  8. 因特尔显卡自定义分辨率_iGame RTX 30系显卡《赛博朋克2077》测试

    <赛博朋克 2077>为一款开放世界动作冒险游戏,故事发生在夜之城.这是一座五光十色的大都会,权力更迭和身体改造是不变的主题.玩家将扮演一名野心勃勃的雇佣兵--V,正在追寻一种独一无二的植 ...

  9. 如何评价英伟达9月2日凌晨发布的30系列新显卡?

    本文整理自知乎问答,仅用于学术分享.如有侵权,请联系后台作删文处理. 编辑|极市平台 导读 就在昨天,NVIDIA创始人黄仁勋正式发布了新一代RTX 30系列显卡.这三款显卡的性能均超过上一代旗舰产品 ...

最新文章

  1. Android resource linking failed
  2. 关于Android 8.0java.lang.SecurityException: Permission Denial错误的解决方法
  3. atoi()函数定义
  4. VLFeat SLIC超像素分割(Cpp版)
  5. IE7一样可以轻易重装
  6. ImportError: libpq.so.5: cannot open shared object file: No such file or directory
  7. jzoj3509-倒霉的小C【gcd,欧拉函数】
  8. C# 只允许运行一个程序实例
  9. 禁术级竞赛刷分技巧:找到跟测试集最接近的有标签样本
  10. 数学建模之图论——图与网络模型(二)(最小生成树问题、最大流问题)
  11. java图片上传并解析,详解SpringMVC实现图片上传以及该注意的小细节
  12. OO第四次总结学期总结
  13. ubuntu切换python默认版本从2.7到3.5后 报错 ImportError: No module named 'pip'
  14. 超融合架构与传统IT架构的区别
  15. (已更新)外卖侠3.10.27版本外卖+售卖影票+任务功能微擎版本程序源码下载
  16. 【超分辨率】何凯明新作:Masked Autoencoders Are Scalable Vision Learners
  17. 实现div半透明效果
  18. Thread多线程-(最容易被问到的面试题)
  19. 软件智能:aaas系统中的数学程序与技术服务之1 序篇之 绪言
  20. github标准pull request提交流程

热门文章

  1. kaggle 泰坦尼克号数据分析 笔记
  2. mysql去除重复数据
  3. 【Java基础】2020如何查看Java官方文档
  4. deepin配置ssh访问
  5. docker-compose 搭建habor
  6. matlab在大气科学,MATLAB入门在大气科学中的应用学术沙龙活动圆满成功
  7. nginx中配置不输入端口(指定地址)访问项目的方法
  8. linux下载ccle数据,对CCLE数据库可以做的分析--转载
  9. 两团队在《自然》上发布重要抗癌研究成果,消化系统肿瘤或有望治愈...
  10. python中的颜色_Python学习第234课——html中的颜色值