Tesla T4视频编码性能分析

从开普勒开始的所有 NVIDIA GPUs 都支持完全加速的硬件视频编码; GPUs 支持完全加速的硬件视频解码。最近发布的图灵硬件提供了张量核心和更好的机器学习性能,但新的 GPU 还加入了新的多媒体功能,如改进的 NVENC 单元,以在视频编解码器中提供更好的压缩和图像质量。

看一看图灵设计的新的 NVENC 单元的性能和质量。

NVENC 性能测试设置

H.264 出现于 15 年前,已经成为一种无处不在的视频编码标准。它已经成为业界最重要和最广泛的编解码器。这些测试展示了 Tesla T4 与著名的开源编码器 libx264 在两种情况下的性能:

·
高质量模式,代表最常见的编码方案与 VBR 控制和 B 帧启用。

·
低延迟快速模式,适用于对延迟敏感的应用程序,如远程游戏或视频会议。

为此,测试计算机的配置如表 1 所示:

这些性能测试将编码参数设置为表 2 中所示的参数:

使用了各种输入视频进行 RD 估计,如 basketball _ drive 、 bq _ terrace 、仙人掌、 crowd _ run 、 ducks _ take _ off 、 jokey 、和服,以及更多分辨率为 1280 × 720 、 1920 × 1080 和 3840 × 2160 的视频。

功耗和质量结果

平衡序列

图 1 到图 4 显示, Tesla T4 在高质量模式下为 libx264 提供相同或稍好的视觉质量,如 Kimono、 BQ Terrace 和 Park Scene 。

图 1. 720p 分辨率和序列的 PSNR-RD 曲线。

图 2 . BQ 阶地序列 1080p 分辨率下的 PSNR-RD 曲线。

图 3 . 场景序列在 720p 分辨率下的 PSNR-RD 曲线。

图 4 . 场景序列的 PSNR-RD 曲线,分辨率为 1080p 。

与 libx264 相比, T4 显示了更好的预测和过滤,如图 5 和 6 所示。

图 5 . 由 libx264 编码的 bq _ terrace 序列的帧。

图 6 . T4-Nvenc 编码的 bq_terrace 序列的帧。

高速运动序列

显著的混沌运动和圆周运动。与 libx264 相比, NVENC 在这些包含复杂内部预测的场景中显示出明显的优势,如图 7 和 8 所示。

图 7. 视频序列在 1080p分辨率下的 PSNR-RD 曲线。

图 8 . 视频序列 1080p 分辨率的PSNR-RD 曲线。

如图 9 和图 10 所示, Tesla T4 NVENC 在低延迟模式下的性能很容易超过 libx264 。请注意 Tesla T4 如何在高分辨率下更有效,在相同的比特率下提供 1db 更好的视觉质量。

图 9 . 1080p 分辨率和低延迟模式下视频序列的 PSNR-RD 曲线

图 10. 视频序列在 2160p 分辨率下的 PSNR-RD 曲线。

如图 11 和图 12 所示,视觉质量的差异很容易被肉眼看到:

图 11 . 由 libx264编码的 ducks_take_off 视频序列的第一帧。

图 12. 由 T4 NVENC编码的视频序列的第一帧。

图灵 GPUs 配备了功能强大的 NVENC 视频编码单元,与 libx264 等复杂的软件编码器相比,它提供了更高的视频压缩效率,因为它结合了更高的性能和更低的能耗。理想的代码转换解决方案需要具有成本效益(美元/流)和节能(瓦/流)。在多个测试序列中平均的性能和功耗结果,如图 13 和 14 所示。

图 13. 在高质量模式下以每秒30 帧同时编码的流数

图 14. 在低延迟模式下以每秒 30 帧同时编码的流数。

T4 以高质量模式同时编码 22 个 720p 流。 GPU 还可以平均处理 10 个 1080p 的流和 2 到 3 个超高清( 2160p )分辨率的流。这相当于在相同的视觉质量级别上几乎是 libx264 的两倍。

在低延迟模式下运行显示出 T4 更大的优势。它可以编码 37 个 720p 分辨率的流, 17-18 个 1080p , 4-5 个超高清,性能比 libx264 高 2-2 . 7 倍,具有更高的视觉质量。可以在图 15 和图 16 中看到每个流的瓦特数。

图 15. 高质量模式下平均每流功耗瓦特

图 16. 低延迟模式下平均每流功耗瓦特

Tesla 还显示出很高的功率效率,在高质量模式下优于 libx264 2-4x ,在低延迟模式下高达 5 倍,同时保持低负载CPU。

结论

与前几代相比, NVIDIA 的 Tesla T4 的编码能力有了很大的提高。与 libx264 这样的软件编码器相比,它在高质量模式下显示出相同或更好的视觉质量,而在低延迟模式下则优于它们。这相当于在功耗降低 2-5 倍时性能提高了一倍。

Tesla T4视频编码性能分析相关推荐

  1. 深度学习赋能视频编码

    深度学习赋予了诸如计算机视觉等领域新的研究契机,其应用也获得了视频编码领域的诸多关注.在LiveVideoStack线上分享中北京大学信息技术学院 助理研究员王苫社详细介绍了当下深度学习在视频编码中的 ...

  2. 编码压缩新思路:面向QoE的感知视频编码

    面向用户体验的感知视频编码即通过机器学习检测用户感兴趣的视觉感知区域,并重新分配以更多的码率与复杂度.本文来自北京航空航天大学副教授.博士生导师 徐迈在LiveVideoStack 线上交流分享,并由 ...

  3. 视频编码帧间学习笔记(个人向初学小结)

    以下链接是视频编码的浅析,原理解释的很详细(像素计算过程错了,但原理没错),小白必看. 视频编码技术详解_tiankong19999的博客-CSDN博客_视频编码1.引言 如今我们所处的时代,是移动互 ...

  4. 性能工具之调试工具 GDB(你以为性能分析中用不到吗?)

    文章目录 一.前言 二.环境依赖 三.Helloword 示例 四.调试 Redis 示例 1.下载 Redis 源码并解压 2.确认编译选项 3.检查编译 4.GDB 调用 redis-server ...

  5. OpenCV测量视频编码和解码的性能(附完整代码)

    OpenCV测量视频编码和解码的性能 OpenCV测量视频编码和解码的性能 OpenCV测量视频编码和解码的性能 #include "opencv2/core/utility.hpp&quo ...

  6. 谁将引领新一代视频编码标准:HEVC、AVS2和AV1性能对比报告

    2013年1月,新一代视频编码标准H.265/HEVC正式发布.然而它并没有像H.264那样占据市场.在这期间,AVS2.AV1等竞争者也在逐步推出,究竟谁才能引领新一代视频编码标准呢? 作者 | 李 ...

  7. 资源放送丨《Oracle存储过程性能分析案例》PPT视频

    点击上方"蓝字" 关注我们,享更多干货! 前段时间,墨天轮邀请数据库资深专家 周玉其 老师分享了<Oracle存储过程性能分析案例>,在这里我们将课件PPT和实况录像分 ...

  8. 音视频开发(30)---新一代视频编码标准:HEVC、AVS2和AV1性能对比报告

    新一代视频编码标准:HEVC.AVS2和AV1性能对比报告 H.265/HEVC 距离H.265/HEVC标准正式发布已经有4年多的时间,虽然其压缩效率比H.264/AVC高出一倍,可以为视频公司节约 ...

  9. 雷达监控与视频监控性能对比分析

    雷达监控与视频监控性能对比分析 摄像监控是目前数字监控的主流,在日常生活中起到非常重要的作用,交通管理.超市.办公场所.重点区域监控都离不开监控摄像头的影子.一方面,监控摄像头保存的视频可以作为违法犯 ...

最新文章

  1. (转)自动化管理工具Saltstack之nginx部署
  2. 4kyu Domino Tiling - 3 x N Board
  3. rhel mysql安装_RHEL6.4下MySQL安装方法及简单配置
  4. SpringBoot安装和创建简单的Web应用
  5. Python——验证码识别 安装Pillow、tesseract-ocr与pytesseract模块的安装以及错误解决
  6. 从0到1打造一款react-native App(二)Navigation+Redux
  7. python可视化数据分析交互作用_测试设计功能交互分析
  8. 熔断机制什么意思_熔断机制是什么意思 股市熔断是什么意思
  9. 掌舵9年,艾伦研究所创始CEO 光荣退休!他曾预言中国AI将领跑世界
  10. Android 原生语音播报
  11. 值得你收藏的办公技巧:word和execl使用技巧
  12. html 奇数div,使用奇数偶数类的Javascript DOM操作
  13. 汇编中的lea指令的作用,简单清晰明了不废话!
  14. vivo怎么调时间_卡西欧手表怎么调时间 怎么评估卡西欧手表的价格档次
  15. MySQL安装时一直卡在starting server...
  16. [JWT]Auth0的JWT时间序列化问题
  17. 网易游戏(雷火、盘古、伏羲)9月线下笔试真题(游戏开发方向)
  18. JS排序算法(升序)
  19. vmin的简单小用例
  20. 化妆品实体店还有出路吗?为什么满大街还是那么多店?

热门文章

  1. Map的分类和不同的应用场景
  2. jenkins+sonarqube流水线脚本模板
  3. IDEA的Docker插件实战(Dockerfile篇)
  4. RPC 笔记(06)— socket 通信(多线程服务器)
  5. debian10 简单的CA使用
  6. 【微服务架构】SpringCloud使用Ribbon实现负载均衡
  7. oracle自动备份
  8. Bert代码详解(一)重点详细
  9. 固态硬盘与QLC闪存
  10. 使用PCAST检测散度以比较GPU和CPU结果