可变形有效感受野的人体图像语义分割算法
DOI:
CSTR:
作者:
作者单位:

(新疆大学 电气工程学院,新疆 乌鲁木齐 830047)

作者简介:

帕孜来·马合木提(1962-),女,硕士,教授,主要从事过程 控制及智能诊断方面的研究.

通讯作者:

中图分类号:

基金项目:

新疆维吾尔自治区自然科学基金(2016D01C038)资助项目 (新疆大学 电气工程学院,新疆 乌鲁木齐 830047)


Body image semantic segmentation algorithm based on deformable effective receptive field
Author:
Affiliation:

(School of Electrical Engineering,Xinjiang University,Urumqi,Xinjiang 830047,Chi na)

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    针对现有人体图像前景目标姿态变化、大小差异 过大和边缘细节丢失等因素造成分 割效果不佳的问题,提出了一种基于可变形有效感受野的人体前景分割算法。该算法将不同 尺度的特征图进行融合,减少下采样过程中丢失的空间语义信息;同时结合可变有效感受野 模块和边缘细化模块来捕获空间信息和语义信息,以适应算法对不同目标的有效感受野范 围,并使有效感受野随目标姿态、大小等形态变化进行扩张;最后采用Focal loss缓解正 负样本不均衡的问题。实验结果表明,在Baidu People Segmentation人体分割数据集上, 对比其他主流语义分割算法,该算法交 并比高达88.45%,相比于主流 语义分割算法 DeepLabV3+高1.07%,相比于经典算法U-net高3.71%,且运行速度快,稳定性好,具有较 高的时效性和良好的鲁棒性。

    Abstract:

    In order to solve the problems of poor segmentation effect caused by th e pose change, large size difference and edge detail loss of the existing body image foreground target,a body foreground segmentation algorithm based on deformable effective receptive field is proposed.The algorithm merges feature maps of different scales to reduce the spatial semantic information lost in the downsampling process;the variable effective receptive field module and t he edge refinement module are combined to capture spatial information and semantic information to i ncrease the effective receptive field range of the algorithm for different targets,and make the effective receptive field expand with the shape change of target attitude,size and so on;finally, focal loss is used to alleviate the imbalance between positive and negative samples.The experimental results show that, on the baidu people segmentation dataset,compared with other mainstream semanti c segmentation algorithms,the intersection ratio of the algorithm is as high as 88.45%,1.07% higher than the mainstream semantic segmentation algorithm deeplab V3+,3.71% higher than the c lassic algorithm U-net,and it has fast running speed,good stability,high timeliness and good robustness.

    参考文献
    相似文献
    引证文献
引用本文

张彬彬,帕孜来·马合木提.可变形有效感受野的人体图像语义分割算法[J].光电子激光,2021,32(9):953~961

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2021-02-03
  • 最后修改日期:
  • 录用日期:
  • 在线发布日期: 2021-11-12
  • 出版日期:
文章二维码