基于DenseNet+FPN网络的视频帧内CU快速划分算法
作者:
作者单位:

(1.沈阳理工大学 自动化与电气工程学院,辽宁 沈阳 110168;2.中国科学院沈阳自动化研究所机器人学国家重点实验室,辽宁 沈阳 11016;3.中国科学院网络化控制系统重点实验室,辽宁 沈阳 110016;4.中国科学院机器人与智能制造创新研究院,辽宁 沈阳 110169;5.沈阳化工大学 信息工程学院,辽宁 沈阳 110142)

作者简介:

张吟龙 (1988-),男,博士,副研究员,硕士生导师,主要研究方向为视频编解码、工业视觉。

通讯作者:

中图分类号:

TN919.8

基金项目:


Video frame-level CU rapid partitioning algorithm based on DenseNet+FPN network
Author:
Affiliation:

(1.School of Automation and Electrical Engineering, Shenyang Ligong University, Shenyang, Liaoning 110168, China;2.State Key Laboratory of Robotics, Shenyang Institute of Automation, Chinese Academy of Sciences, Shenyang, Liaoning 110016, China;3.Key Laboratory of Networked Control Systems, Chinese Academy of Sciences, Shenyang,Liaoning 110016, China;4.Institutes for Robotics and Intelligent Manufacturing, Chinese Academy of Sciences, Shenyang, Liaoning 110169, China;5.College of Information Engineering, Shenyang University of Chemical Technology, Shenyang, Liaoning 110142, China)

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    针对多功能视频编码(versatile video coding,VVC)帧内编码中编码单元(coding units,CU)划分存在计算复杂度过高的问题,本文提出了一种基于DenseNet+FPN(feature pyramid network)的CU快速划分算法。该算法能够大幅度降低VVC的编码复杂度,减少编码时间。首先,本文提出了一种基于纹理复杂度的CU分类算法,来评估CU块的纹理复杂度。其次,提出一种基于DenseNet+FPN的网络模型,利用多尺度信息来优化CU划分,以适应多尺度情况下的编码需求。最后,设计了一个新的自适应的质量复杂度均衡损失函数,用于平衡编码质量和计算复杂度。所提算法进行了大量的实验分析,结果证明,与公共参考软件(WC test model 10.0,VTM10.0)相 比,所提算法的帧内编码平均时间减少了44.268%,而BDBR(bjntegaard delta bit rate)仅增加了0.94%。

    Abstract:

    To address the issue of high computational complexity in coding units(CU)partitioning for versatile video coding(VVC)intra-frame coding,this paper proposes a CU fast partitioning algorithm based on DenseNet+FPN (feature pyramid network).The algorithm significantly reduces the encoding complexity of VVC,resulting in reduced encoding time.Firstly,a CU classification algorithm based on texture complexity is proposed to evaluate the texture complexity of CU blocks.Secondly,a network model based on DenseNet+FPN is introduced,utilizing multi-scale information to optimize CU partitioning to adapt to encoding requirements in various scales.Lastly,a novel adaptive quality-complexity balanced loss function is designed to balance encoding quality and computational complexity.Extensive experimental analysis is conducted for the proposed algorithm,and the results demonstrate that compared to VVC test model(VTM)10.0,the average encoding time of the proposed algorithm is reduced by 44.268%,while the bjntegaard delta bit rate (BDBR) only increases by 0.94%.

    参考文献
    相似文献
    引证文献
引用本文

程栋梁,张吟龙,周道先,冯选.基于DenseNet+FPN网络的视频帧内CU快速划分算法[J].光电子激光,2024,35(11):1208~1214

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2023-06-15
  • 最后修改日期:
  • 录用日期:
  • 在线发布日期: 2024-09-27
  • 出版日期: