本文来自ICME论文《MACHINE LEARNING-BASED RATE DISTORTION MODELING FOR VVC/H.266INTRA-FRAME 》

文章提出利用4种传统机器学习模型构建VVC帧内编码帧的RD模型。

RD模型

Fig.1是整个算法的流程。首先,从输入序列提取特征。然后,利用模型调整帧内编码帧的RDO。重复以上过程直到整个序列编码完。

RDO可以描述为在给定码率下使得失真最小,如下式,

在构建RD模型时除了要考虑码率,还需要考虑视频内容。本文提出了基于机器学习的RD模型,如下式,

式中Do是最优的失真,P(.)是基于学习的RD模型,F是和视频内容相关的特征向量。

Fig.2是RD模型的优化过程。

特征选择

文章使用多尺度各向异性方向导数(multi-scale anisotropic directional derivative,ADD)滤波器来提取帧内编码帧的特征。ADD可以提取边缘和角点处的各向异性强度变化特征。

帧内编码帧I在角度θ  上的ADD特征为:

其中⊗  表示卷积操作。I(i,j)表示亮度通道在(i,j)处的像素值。psi(θ)是ADD滤波器。

文章提取了4个ADD特征:

(1)F_mean:为了描述I的强度,在水平和垂直方向上计算F_ADD的均值:

(2)F_max:F_max是两个方向的F_ADD最大值,F_max越大表示该帧水平或垂直方向性更强:

(3)F_min:F_min是两个方向的F_ADD最小值,F_min越小表示该帧水平或垂直方向越平坦:

(4)F_var:F_var(θ)反映I在方向θ的平坦性,F_var反映I的整体平坦性:

为了展示以上特征和码率的关系,Fig.3画出了实际编码比特数和ADD特征的关系,使用的序列为“Campfire”,QP=27。

可以看见ADD特征和码率有很强的相关性。最终视频内容特征F定义如下:

机器学习实现

使用4个传统的机器学习算法来训练P(R_t,F)模型。SVR(Support Vector Regression)、RFR(Random Forest Regression )、GPR(Gaussian Process Regression)、ANN(Artificial Neural Networks),训练预测模型P(.),特征为(R_t,F),label为D_o。

数据集:训练数据包括41条序列,每条序列的最后20帧用于训练模型。测试序列是VVC标准的26个序列的前20帧。

训练:整个训练过程如Fig.1所示。每条序列使用4个QP(22、27、32、37)编码以获得RD cost作为label。使用4种机器学习方法训练P(R_t,F)预测模型。

为了获取VVC中最优的label D_o,采用多QP优化。设置4个初始QP_initial,然后搜索它周围的13个QP(QP_initial-6到QP_initial+6),为每个CTU选择最优的QP以使RD cost最小,称为optimal R-D model 。

起始I帧的码率控制

起始I帧(IDR帧)无法利用之前的码率控制信息,给定目标码率R_t,使用拉格朗日乘子模型,

实验中SVR模型使用RBF作为核函数,参数gamma=8,C=4,epsilon=0.0078。RFR模型有80棵树,最大深度16。GPR模型超参数为(0.1,10)。ANN模型层结构为5x15x30x1。

实验结果

实验平台为VTM7.0,测试序列为VVC的26条序列,使用All-intra配置,编码器参数T emporalSubsampling 设为1。每天序列设置的码率由4个固定QP(22,27,32,37)编码结果获得。为了确保当前的帧内编码帧不能获取之前的帧的参考信息,编码过程中模型参数和每帧的目标比特数不更新。

RD效果

Fig.4展示了4条序列的结果。可以看见本文算法效果与optimal R-D model相近,优于VTM7.0。但是多QP优化复杂度高很难实际应用,所以本文算法在计算复杂度和编码效果上达到更好的平衡。

表1是初始I帧码率控制的结果。

Fig.5是两条序列的码率波动情况,可以看见基于学习的方法的码率更接近目标码率。

Fig.6是亮度分量的PSNR变化,可以看见GPR和ANN的PSNR更稳定。Fig.7是主观效果,4种机器学习模型要优于VTM7.0。

感兴趣的请关注微信公众号Video Coding

ICME2021:基于机器学习的VVC帧内编码码率控制相关推荐

  1. VVC码率控制中的质量依赖因子QDF

    本文来自提案JVET-M0600<Quality dependency factor based rate control for VVC> VTM沿用了HM中的码率控制方式,即R-lam ...

  2. ICIP2020:VVC码率控制

    本文内容来自ICIP 2020的文章<RATE CONTROL FOR VERSATILE VIDEO CODING> 该文章主要是通过对skip块的分析提出了RD参数的更新策略和帧级码率 ...

  3. 图像编解码:CRF(质量/码率控制)和QP

    什么是CRF? CRF是264和265中默认的质量/码率控制设置.这个值可以在0到51之间,值越低,质量越好,文件大小越大.在x264上面,一般取值为18-28,默认值是23.在ffmpeg中,crf ...

  4. lstm中look_back的大小选择_基于机器学习检测僵尸网络中的域名生成算法

    0x01 Absert 恶意软件通常使用域名生成算法(DGA)作为联系其C&C服务器的机制.近年来,基于机器学习已经提出了不同的方法来自动检测生成的域名.但也存在一些问题.第一个问题是,由于缺 ...

  5. 机器学习算法如何应用于控制_将机器学习算法应用于NBA MVP数据

    机器学习算法如何应用于控制 A step-by-step tutorial in R R中的分步教程 1引言 (1 Introduction) This blog makes up the Machi ...

  6. H.264码率控制机制

    H.264标准码率控制算法步骤如下: 1.计算当前帧的目标码字,并将其限定到HRD的边界中. 2.通过线性模型(式4.5)预测当前帧中基本单元的MAD. 3.为未编码基本单元分配码字. 4.通过二次R ...

  7. 基于机器学习的网络安全态势感知

    人工智能技术与咨询 点击蓝字 · 关注我们 来源:<计算机科学与应用> ,作者杨怡等 关键词: 机器学习:态势感知:关联分析:攻击场景重建 摘要: 摘要: 在传统网络防御手段抵御攻击的基础 ...

  8. x264编码指南——码率控制

    x264是一个 H.264/MPEG4 AVC 编码器,本指南将指导新手如何创建高质量的H.264视频. 对于普通用户通常有两种码率控制模式:crf(Constant Rate Factor)和Two ...

  9. 论文研读-AI4VIS-可视化推荐-VizML: 一种基于机器学习的可视化推荐方法

    VizML: 一种基于机器学习的可视化推荐方法 1 论文概述 1.1 摘要 1.2 引言 2 问题陈述 3 相关工作 3.1 基于规则的可视化推荐系统 3.2 基于机器学习的可视化推荐系统 4 数据 ...

最新文章

  1. Django restful-framework初步学习
  2. 软件开发环境-环境信息库
  3. ios button.imageview 和setimage的区别
  4. typedef 函数指针的用法
  5. 一致性协议raft详解(四):raft在工程实践中的优化
  6. MAC usb启动盘制作
  7. JavaOne 2016后续活动
  8. python处理滑块验证码_使用python实现滑动验证码
  9. 以计算机为题写一篇英语作文,请以“未来的钢笔”为题写一篇不少于80词的英语作文...
  10. day2在基础控制器里面¥this-request ,$this-response,把用户信息存在session,封装jsonResult返回值,Redis门面和Cache不一样...
  11. [翻译]深入解析Windows操作系统(下)之第十章 内存管理
  12. 百度干净云(无广告不限速的绿色百度云客户端)
  13. 多测师_设置 Linux 支持中文
  14. Ubuntu 命令行下修改IP等
  15. Boobooke (播布客) 是个好网站
  16. linux中流设备_Linux纯干货知识总结|面试专用
  17. mysql useing_mysql中using where,using index
  18. 河南python培训班
  19. 服务器恢复系统怎么操作,windows2008用装置盘恢复服务器操作体系
  20. MySQL 冷备份操作 + shell 脚本自动备份

热门文章

  1. 接口测试实战项目02:根据接口文档测试
  2. Docker进入/退出容器命令
  3. 360手机刷机·EdXposed安装和使用教程
  4. php取网盘真实链接,【已解决】获取蓝奏云真实链接问题?
  5. 火到服务器瘫痪了,这款小游戏太火爆了,合成大西瓜
  6. MyBatis 常见面试题有哪些?
  7. 云原生周报 | K8s 官方推出纪录片;BFE 2021开源总结;服务网格在联通的落地实践
  8. 有没有人可以解答一下?
  9. express 热更新
  10. 2.Bulldog渗透实战