关键词:
H.266/VVC
码率控制
深度学习
内容感知
摘要:
针对新一代视频编码标准H.266/VVC在视频编码码率分配过程中忽略了人眼视觉冗余这一问题,提出一种基于内容感知的码率分配策略。对于一幅图像,人们往往只会关注某些特定的区域,而显著性特征则可以很好地评估人眼对不同区域的感兴趣程度,并且借助注意力机制可以更好地衡量人眼视觉特性,因此设计了一种基于多尺度注意力机制的视频显著性网络。该网络通过注意力模型来计算视频序列不同时空特征的重要程度并为其分配不同权重,生成视频序列的显著性特征。基于获得的显著性特征以及视频内容特性,提出一种新的视频码率分配策略,对帧级和CTU级目标码率进行分配,来提升视频的感知质量。实验结果表明,与H.266/VVC参考软件VTM 15.0相比,在图像全局质量损失很少的情况下,显著性区域的码率节省了19.52%,码控精度也有所提升。