基于深度学习的场景文本检测算法研究
DOI:
CSTR:
作者:
作者单位:

(1.湖北工业大学 电气与电子工程学院,湖北 武汉 430068; 2.美国南卡罗来纳大学 计算 机科学与工程系,南卡 哥伦比亚 29201)

作者简介:

熊炜(1976-),男,博士,副教授,硕士生导师,主要从 事数字图像处理和计算机视觉方面的研究.

通讯作者:

中图分类号:

基金项目:

国家自然科学基金资助项目(61571182,61601177)、湖北省自然科学基金项目(2019CFB530)、湖北省科技厅重大专项 (2019ZYYD020)和国家留学基金项目(201808420418)资助项目 (1.湖北工业大学 电气与电子工程学院,湖北 武汉 430068; 2.美国南卡罗来纳大学计算机科学与工程系,南卡 哥伦比亚 29201)


Research on scene text detection algorithm based on de ep learning
Author:
Affiliation:

(1.School of Electrical and Electronic Engineering,Hubei University of Technolog y,Wuhan,Hubei 430068,China; 2.Department of Computer Science and Engineering,Uni versity of South Carolina,Columbia,SC 29201,USA)

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    针对自然场景中任意形状文本图像因文本行难以区分导致的信息丢失问题,提出了 一种基于深度学习的场景文本检测算法。首先构建特征提取模块,使用Resnet50作为骨干 网络,在增加跨层连接的金字塔网络结构中引入并联的空洞卷积模块,以提取更多语义信息; 其次,对得到的特征图进行多尺度特征融合,学习不同尺度的特征;最后预测出不同内核大 小的文本实例,并通过尺度扩展逐渐扩大文本行区域,直到得到最终的检测结果。实验结果 表明,该方法在SCUT-CTW1500弯曲文本数据集上的准确率、召回率及F1值分别达到88.5%、 77.0%和81.3%,相比其他基于分割的算法,该算 法对弯曲文本的检测效果良好,具有一定的 应用价值。

    Abstract:

    To solve the problem of information loss of arbitrary shape text detect ion in natural scenes,a scene text detection algorithm based on deep learning is propo sed.Firstly,a feature extraction module was constructed,Resnet50was used as the backbone net work,and a parallel void convolution module was introduced into the pyramid network struc ture with cross-layer connections to extract more semantic information.Secondly,multi- scale feature fusion is performed on the obtained feature map to learn features of different s cales.Finally, the kernel size of text line of different scales is predicted and the predicted text line area is gradually expanded until the final detection result is obtained.Experimental re sults show that the evaluation indexes of accuracy,recall and F1-measure of the model on SCUT -CTW1500curved text dataset reach 88.5%,77.0% and 81.3%,respectively.Compared with othe r segmentation-based algorithms,this algorithm has a good detection effect on cu rved text;therefore,it has certain application value.

    参考文献
    相似文献
    引证文献
引用本文

熊炜,艾美慧,杨荻椿,李利荣,刘敏,王娟,曾春艳.基于深度学习的场景文本检测算法研究[J].光电子激光,2021,32(7):728~734

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2020-12-26
  • 最后修改日期:
  • 录用日期:
  • 在线发布日期: 2021-11-12
  • 出版日期:
文章二维码