根据Cisco VNI数据,预计到2022年,全球CDN流量规模将达到252EB/m,其中,互联网视频流量占比呈逐年上升趋势。在视频行业高速发展的过程中,带宽、网络得以丰富,视频的高清体验不断提升,分辨率从1k、4k到8k,甚至到超高清。从生物学角度,满足人眼真正的沉浸式需要50k分辨率。高清视频的发展使得用户对视频/图像质量的要求永无止境,其真实体验感受评测难度也相应增加,如何全面客观评价视频画质的质量是否得到提升?

“针对以上难题,金山云发布图像视频感知评价指标Kingsoft Cloud Perceptual Assessment(KPA),希望以此助力行业实现‘让视频更高清’的目标。”金山云高级研发总监樊鸿飞在在近日的LiveVideoStackCon 2020北京(音视频技术大会)上表示。

比VMAF应用范围更广

当下,主观质量评价和客观质量评价是行业内两大类图像视频质量评价方法,其中客观质量评价分为全参考评价指标、半参考评价指标和无参考评价指标。据樊鸿飞介绍,目前,能够达到商用级的评价指标非常少,学术界的评价指标主要都是针对有非常明确边界条件约束的场景。商用级的全参考评价指标目前除了PSNR和SSIM之外,就是Netflix在2016年发布的VMAF了,VMAF是第一个开源的商用评价指标,也是高清视频领域的并经之路。无参考评价指标主要有BRISQUE、NIQE和VSFA,金山云KPA选择了无参考这个赛道。

KPA与VMAF的区别在于,一方面VMAF是全参考的画质视频指标,而KPA是一组无参考的画质视频指标,KPA可以应用在全参考来计算DMOS,同时KPA除了通用的整体质量评价外,还包括子维度质量、局部质量等细分评价指标,应用范围更广泛;另一方面,VMAF针对高清PGC视频有比较强的能力,针对UGC没有进行特殊优化,而KPA主要针对UGC视频。

金山云KPA主要希望用客观指标来衡量人眼的主观感受。“然而在画质评测行业,用客观指标来衡量主观质量一直以来都是一个世界难题。由于设备分辨率、观测距离、屏幕大小的区别等,观看同一段视频的主观质量体验会存在差距。此外,除了整体分数以外,还有各个子维度的分数,比如色彩、亮度、清晰度、畸变等。另外还涉及到网络卡顿问题、VR视频......,问题非常复杂。因此,金山云KPA并不是用一个算法来解决所有的事情,目前发布的KPA主要针对于UGC视频,对于播放场景的映射也是针对于常用场景,同时我们也在探索包括子维度评价、局部评价、评价映射等主观评价的各细分业务场景指标。”樊鸿飞表示。

在UGC场景排名问鼎

针对现有评价指标算法,尤其是无参考评价算法精度较低的问题,金山云KPA主要从两个方向进行了重点研究和优化:一个是数据筛选,另一个是模型攻防。

在数据层面,通过收集各种场景下UGC及PGC视频,并保证至少50以上的专业评测人员对每个视频进行主观评测,从源头上避免数据主观评测波动和精度问题。同时,对收集到的数据,从内容、场景、质量等多个维度进行平衡筛选,在确保数据规模远超业界开源数据的基础上,提升数据的多样性。在模型层面,通过攻防设计、协同学习、困难样本挖掘等方法,提升模型的鲁棒性和精度,在UGC场景中SROCC和gMAD分数均优于业界知名的有参考算法VMAF。

金山云KPA可以有效应用于编码及AI方向,避免或减少画质损失,提升视频或图像主观质量。在编码方向,通过KPA对视频进行场景级、帧级等全局质量预测分析,块级局部质量预测分析,结合JND模型作为其最小可察觉主观失真衡量,并由此自动决策出编码所需要的CRF、QP等参数,能更好地匹配人类视觉主观系统,消除视觉感知冗余,在保证主观质量相同的情况下降低码率或者在相同码率下提升主观质量;在AI增强方向,通过将KPA的全局/局部/子维度评价作为不同侧重点的loss或者判别器加入到模型训练中,指导模型朝更好的画质方向进行优化,进一步提升主观画质。

“在近几年对AI的研究中发现,这项技术可在众多领域广泛应用,且能大幅度提升各领域的原有性能。在画质评测相关的任务中,AI也帮助我们大幅度提升了SROCC和PLCC等指标。未来,我们的重点研究方向包括:1.进一步提升KPA泛化性,完善对各分辨率视频映射能力;2.提升视频编码中JND、RDO等模块算法主观质量;3.利用KPA进行更好的超分辨率、去噪等AI算法研发;4.针对相机拍摄所需要的偏色、暗场、畸变等维度研究评价指标。一方面,我们希望KPA能够抛砖引玉,吸引更多学术界的学者来关注企业应用中真正的诉求;另一方面,希望KPA能够帮助视频行业进一步提升视频质量,推进视频高清应用的发展。”樊鸿飞在演讲最后表示。

金山云发布感知评价指标KPA 拨开遮挡高清视频技术的迷雾相关推荐

  1. 客观指标VS主观质量:拨开遮挡高清视频技术的迷雾

    金山云将在LiveVideoStackCon 2020北京站发布金山云图像视频感知评价指标Kingsoft Cloud Perceptual Assessment(KPA),这也是金山云与香港城市大学 ...

  2. 小米联合金山云发布“1KM边缘计算” 携手布局“云+边缘”新赛道

    金山云CEO王育林: "今天是一个特别特别特别的发布会,因为小米每次发布会都有硬件,而这次是和我们金山云联合发布"1KM边缘计算"解决方案,打造"云+亿级终端& ...

  3. 2021 云原生开门红,金山云发布全新云原生全景图

    据云原生计算基金会(CNCF)数据显示,当前企业已经在广泛使用云原生技术,容器应用已成常态, 2019 年 84% 的公司在生产中使用容器,而 2016 年仅为 3%.据阿里达摩院最新2021年科技趋 ...

  4. 金山云发布全新Serverless产品 云原生基础设施再升级

    随着企业数字化转型的深入,云计算正全面步入2.0时代,即为云而生的阶段.以云原生为代表的理念,已经成为进一步释放云计算价值的核心推动力. 1月6日,金山云举行了云原生媒体沟通会,金山云副总裁.合伙人钱 ...

  5. 金山云发布画质增强KIE,AI赋能提升超清体验

    自从苹果开创无键盘设计时代之后,手机厂商便把人机交互中最重要的屏幕相关技术作为核心的差异化手段.除了不断优化包括图像采集相关的能力,更是在屏幕尺寸和分辨率上不断推陈出新.比如手机从厚到薄,从5英寸以内 ...

  6. 云计算三层架构_金山云发布星曜裸金属服务器 打造面向云计算2.0的云基础架构...

    "随着云计算2.0时代的全面到来,用户对于算力的需求正在发生明显的变化,如何提供兼具高性能.高稳定性和高安全性的服务器,更好地满足新时期用户的算力需求,是云厂商需要解决的首要问题." ...

  7. 华为云发布 GaussDB(DWS) 实时数仓,技术创新释放行业数据价值

    8 月 31 日,在华为云 TechWave 大数据专题日上,华为云发布了 GaussDB(DWS)实时数仓,工商银行.广东移动.清华大学等分享了大数据技术创新及应用实践. 围绕数据全生命周期提供整体 ...

  8. 阿里云发布行业首个「视频直播技术最佳实践图」!

    2022阿里云直播峰会于7月8日落下帷幕,多位直播产业领域技术专家与行业先行者,共同探讨超视频化时代直播技术的演进趋势与未来发展. 此次大会,重磅发布了行业首个「视频直播技术最佳实践图」,将直播技术归 ...

  9. MSU2020年度世界视频编码大赛 金山云斩获UGC赛道冠军

    近日,莫斯科国立大学(Moscow State University)举办的世界视频编码器大赛传来好消息,金山云自主研发的KAV1编码器在UGC赛道中拔得头筹. MSU视频编码大赛是全球盛宴,在视频编 ...

最新文章

  1. 服务器开启虚拟机就死机,解决ESXi服务器上磁盘锁导致虚拟机卡死的问题
  2. nginx已添加systemctl,但不能开机自启动问题
  3. 前沿分享|阿里云数据库资深技术专家 姚奕玮:AnalyticDB MySQL离在线一体化技术揭秘
  4. Python_items()方法【详解】——Python系列学习笔记
  5. 友善之臂编linux内核,友善之臂NanoPC-T3 Plus,s5p6818编译Linux内核流程
  6. 【拓扑排序】【DP】旅行计划(luogu 1137)
  7. 在浏览器控制台执行以下代码,输入的结果是()
  8. leetcode743. 网络延迟时间(迪杰斯特拉算法)
  9. C++中对string对象的初始化及赋值方式总结
  10. Java学习笔记——JDBC之与数据库MySQL的连接以及增删改查等操作
  11. 二段式提交和三段式提交
  12. 我国低轨宽带通信卫星系统建设迈出了实质性的一步
  13. 恭喜我司李震博士被聘为南京航空航天大学兼职教授
  14. PS打造电影金属字体
  15. 【tensorboard】解决ValueError: Duplicate plugins for name projector
  16. Python3网络爬虫requests库保存登录cookies无法显示登录后的结果
  17. 3.1 Docker最新入门教程-Docker入门-概述
  18. 【PyTorch】1入门——Tensor、自动微分、神经网络、PyTorch 图像分类
  19. 欧姆龙e5dc温控器_E5DC-QX2DSM-800手册欧姆龙 数字温度控制器E5DC-QX2DSM-800用户手册 - 广州凌控...
  20. Nginx真的消除了惊群效应么?不

热门文章

  1. 《Android之大话设计模式》--设计原则 第三章:开放封闭原则 孙悟空任弼马温一职
  2. python 创建画板_OpenCV +Python 制作画板
  3. unity3D中的伽马空间和线性空间
  4. php安装protocol buffer 扩展,thinkphp引入protocol buffer
  5. 光谱数据计算CIE值(三刺激值、CIE1931、CIE1976、CCT)软件人品大家自己看
  6. (论文笔记06.High Fidelity Data Reduction for Big Data Security Dependency Analyses(CCF A)2016)
  7. Python解析SWAN气象雷达数据--(解析、生成ASCII、Image、netCDF)
  8. 只因小黑子的jquery入土过程
  9. Bootrap 项目实战(微金所前端首页)第三部分(CSS,js源码)
  10. 【优麒麟 UbuntuKylin】他来了他来了!麒麟移动应用环境上线了!