王豪:HW265到“HW266”
每年的MSU的视频压缩评比报告都是多媒体的热点话题之一,在MSU 2018评比中,华为HW265在多项测试中排名第一。LiveVideoStack采访了华为媒体技术院视频编码团队负责人王豪,在参赛之前,HW265已经在多领域商用。未来华为将投入到VVC的研发,并看好AV1的下一代AV2。
文 / 王豪
策划 / LiveVideoStack
LiveVideoStack:王豪你好,向LiveVideoStack的读者介绍下自己,以及您(或您团队)目前负责工作和感兴趣的技术方向。
王豪:我毕业于华中科技大学,2011年加入华为,现任媒体技术院视频编码团队负责人,一直从事流媒体、视频编解码、质量评价等领域的研究和开发工作。团队目前关注于泛娱乐视频领域的视频技术,包括视频编码/处理,视频传输和视频分析,目的就是能为用户提供极致的视频体验。
LiveVideoStack:能否介绍下华为媒体技术院?
王豪:中央媒体技术院隶属于2012实验室,是华为公司媒体技术创新和工程能力中心,对媒体领域产品技术竞争力负责。面对客户、产业和公司未来业务的挑战和机遇,持续聚焦媒体领域的技术研究、创新和突破,确保公司媒体产品核心竞争力持续领先,支撑华为公司长期商业成功。
LiveVideoStack:MSU发布2018年视频压缩评比报告中,华为Codec在YUV-SSIM得分排名第一。这个成绩很了不起,能简单总结下这次华为Codec的成绩吗?
王豪:这里自夸一下,HW265在MSU 2018编码器评比中,SSIM和VMAF总成绩均排名第一,尤其SSIM的三个测试场景(极致压缩,通用编码,快速编码)均为单项第一,压缩率平均优于友商7%,在互联网常用的快速编码场景测试中,HW265压缩率(BDBR)优于友商12%。
LiveVideoStack:随软MSU每年的评测已是业界顶级,但也有不少吐槽。比如测试场景已经跟不上实际业务,视频数据集少等。您认为这项评测还有那些改进的地方?
王豪:先说下MSU评测的参数,评价码率范围:1mbsp~12Mbps,不考虑码率波动,在素材选择方面,根据时空域复杂度,选择不同复杂度区间的视频,同时人工考虑素材场景,尽量包含不同类型的素材,编码速度考虑三个不同档位,速度为1fps,25fps,60fps。
我觉得谈合理性,取决于其评比的出发点,我理解MSU编码器评比的出发点就是尽可能的评价编码器的通用编码能力,因为大家知道不同视频应用场景,设定码率,码控波动,场景复杂度,编码速度都不同,例如IPTV整体码率偏高,但码率波动小,OTT点播码率低,但允许的波动大。
所以MSU在评测中,在以上几方面从场景覆盖和评测的简易方面进行均衡,个人觉得目前MSU评测配置挺合理的。
如果改进的话,MSU素材方面一直选取高质量素材,后续可以考虑增加一些质量一般的UGC视频。
LiveVideoStack:聊聊华为Codec的前生今世吧,他有哪些特点?未来还有那些改进计划?
王豪:HW265开发于2013年HEVC标准刚出的时候,以HM为基准,我们做了大量的重构、优化,最终于2014年定稿,那时主要给国内外运营商使用,包括IPTV、离线转码等场景。从2016年开始,支撑华为视频、华为公有云的点播与直播商用。
我觉得HW265最大的特点是通用性好,我们在编码器内核方面做了很多优化,尤其在快速算法方面进行了深度开发和优化,保证编码内核的通用竞争力。
同时以HW265内核为基础,我们进行感知编码研发——“高清低码”,将场景优化,质量评价,视频处理与编码器结合,为用户提供极致的视频体验。
关于改进,后续我们将引入更多基于数据驱动的算法,例如结合深度学习,强化学习等来提升编码速度和质量,同时也会针对超高清以及VR/HDR进行编码工具优化。
LiveVideoStack:华为Codec在哪里平台或产品上部署?
王豪:我们主要聚焦泛娱乐视频场景,HW265从2014年开始已经在华为运营商业务(无线,核心网),华为视频, 华为公有云,welink直播(华为内部APP)等平台商用,已经过全面商用考验。
LiveVideoStack:是否评估过AV1?未来是否有可能提供AV1的方案?您怎么看待未来Codec的市场格局?
王豪:我们内部对AV1和HEVC的参考软件进行评测和分析,从压缩效率讲,AV1稍优于HEVC,基本上属于同一代,但AV1的参考软件复杂度是HEVC的40~50倍,优化难度比较高。
团队暂时没有计划提供AV1方案,个人觉得AV1来的有点晚,因为VVC 预计2020年进行发布,团队明年会投入VVC的优化。由于HEVC的专利纷争,我觉得VVC的专利政策肯定会相对温和,更适宜产业使用,个人反而对AV2更加期待。
未来的Codec市场格局是群雄割据场景,之前AVC一统江湖的时代已经一去不复返了,后续主要看各家的终端话语权,个人从竞争力方面还是看好VVC。
王豪:HW265到“HW266”相关推荐
- 编码压缩新思路:面向QoE的感知视频编码
面向用户体验的感知视频编码即通过机器学习检测用户感兴趣的视觉感知区域,并重新分配以更多的码率与复杂度.本文来自北京航空航天大学副教授.博士生导师 徐迈在LiveVideoStack 线上交流分享,并由 ...
- 音视频技术开发周刊 70期
『音视频技术开发周刊』由LiveVideoStack团队出品,专注在音视频技术领域,纵览相关技术领域的干货和新闻投稿,每周一期.点击『阅读原文』,浏览第70期内容,祝您阅读愉快. 架构 UDP成为低延 ...
- 华人的战场——MSU视频编码大赛
从HW265到腾讯香农编码器,从sz264/sz265到UCodec,当然还有金山265,在MSU视频编码评测排名靠前的参赛者大部分来自本土公司或华人工程师的贡献.LiveVideoStack试图通过 ...
- 全栈工程师如何逆袭?
"少壮不努力,老大当全栈",和高大上的数据工程师.架构师.算法工程师比起来,全栈工程师似乎就是个打杂的.但你见过一家公司的研发团队全是全栈工程师的情况吗? 文 | 全栈的小v 道哥 ...
- Swift 教學:如何使用iOS Charts API 製作漂亮的圖表
在應付許多的資料時,比起只在表格中呈現,使用圖表來顯示資料,可以幫助使用者容易地了解資訊.有了圖表,相對於讀取整個資料表(或幾個資料表)你可以輕鬆地一眼便見到以圖形表示的資料,取得所需的資訊.圖表的使 ...
- 华为昇腾AI全栈知识深入解读,师资培训沙龙深圳场圆满落幕!
头图 | 视觉中国 极度缺乏AI人才,已成为中国人工智能产业发展道路上的瓶颈.在国家政策的支持下,众高校初建AI专业者甚多,但高校教师应掌握哪些知识储备来传道授业,大家都是"摸着石头过河&q ...
- AI 技术发展飞快,高校 AI 教师的知识储备能满足学生旺盛的求知欲吗?
2019 年,AI 技术以惊人的速度发展:2020 年,AI 技术成熟的时机已经到来,随之而来的,是越来越旺盛的 AI 人才需求. 近日,国家正式发布了一份<2020 年人工智能产业人才发展报告 ...
- Sql语句查询 显示序号
怎么样用SQL语句查询出来带有序号,不是我们用递增所带的ID号 就是按行数用数字显示出来 序号,id,userid 1 5 aaa 2 6 bbb 3 8 ccc 4 9 ddd 5 17 eee 类 ...
- 人工神经网络发展历史及算法应用综述
作者:柯悦 简 介: 人工神经网络概念自提起以来,它的发展经历了起起落落,而如今人工神经网络也与各个领域相结合,实现它的价值.人工神经网络主要用来处理分类与回归的问题.决定神经网络发展的三个基本要素主 ...
最新文章
- jwt思维导图,让jwt不再难懂
- pytorch 数据加载性能对比
- EJB(Enterprise Java Bean)存在的问题
- Java基础教程:面向对象编程[2]
- 想要学好C++有哪些技巧?
- 奔跑吧兄弟变成机器人是哪一期_奔跑吧预告,郑恺郭麒麟回归,而我却被女嘉宾的颜值吸引了...
- Oracle中较长number型数值的科学计数显示问题
- COGS 1299. bplusa【听说比a+b还要水的大水题???】
- (zz)楚王何故好细腰
- 餐巾计划(网络流24题之二(模板2))
- 系统运行时间校准的重要性
- xshell 导入.xsh 文件
- 论文阅读|Pre-trained Models for Natural language Processing: A Survey
- opengl 画椭圆_如何用彩铅画一朵牡丹?彩铅牡丹花的画法步骤,彩铅花卉画入门教程...
- vue使用高德地图实现实时天气预报功能
- 基于Qt的上古神器-Qt Cryptographic Architecture (QCA)加密库介绍
- MAC系统字体库存放目录
- label 标签的巧妙使用
- 如何找到微信公众号的视频链接及视频?
- linux 中read命令后面-p是什么意思呢