融合Transformer和线索交叉聚合的结直肠息肉分割方法
CSTR:
作者:
作者单位:

(1.江西理工大学 电气工程与自动化学院,江西 赣州 341000;2.江西省通讯终端产业技术研究院有限公司 软件部,江西 吉安 343000)

作者简介:

梁礼明 (1967-),男,硕士,教授,硕士生导师,主要研究方向:机器学习和医学影像。

通讯作者:

中图分类号:

TP391.4

基金项目:

国家自然科学基金(51365017,61463018)、江西省自然科学基金面上项目(20192BAB205084)和江西省教育厅科学技术研究重点项目(GJJ170491,GJJ2200848)资助项目


Colorectal polyp segmentation method fusing Transformer and cross-cue fusion
Author:
Affiliation:

(1.School of Electrical Engineering and Automation, Jiangxi University of Science and Technology,Ganzhou, Jiangxi 341000, China;2.Software Department, Jiangxi Communication Terminal Industry Technology Research Institute Co.,LTD, Ji′an, Jiangxi 343000,China)

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    针对结直肠息肉图像分割时动态信息处理和边缘细节捕捉能力不足,导致边界信息损失和错误分割等问题,本文提出一种建立在Swin Transformer框架上的线索交叉聚合(cross-cue fusion,CCF) 结肠息肉分割方法。该方法首先通过Transformer编码器对图像的病变特征进行逐级提取。其次利用改进的二阶通道注意力(second-order channel attention,SOCA) 机制增强跨层级信息交互能力,有效提取丰富的多尺度上下文特征信息。再次采用反向通道频率注意力(reverse channel frequency attention,RCFA) 机制中的离散余弦变换(discrete cosine transform,DCT) ,突出多尺度上下文信息的通道特征。最后通过CCF模块从动态和静态深度两个层面增强图像特征,进而提升动态信息处理和细节捕捉能力。在数据集CVC-ClinicDB、Kvasir、CVC-ColonDB和ETIS- LaribPolypDB上进行测试,Dice指数分别为0.942、0.924、0.800和0.774。MIoU指数分别为0.896、0.878、0.726和0.697。实验数据表明,本文提出的方法能有效分割结直肠息肉图像,为结直肠息肉的诊断提供了新思路。

    Abstract:

    In order to solve the problems of insufficient dynamic information processing and edge detail capture in colorectal polyp image segmentation,such as boundary information loss and wrong segmentation,this paper proposes a colorectal polyp segmentation method based on Swin Transformer framework.Firstly,Transformer encoder is used to extract the pathological features of the image step by step.Secondly,the improved second-order channel attention (SOCA) mechanism is used to enhance cross-level information interaction ability and effectively extract rich multi-scale context feature information.Furthermore,the discrete cosine transform (DCT) in the attention mechanism of reverse frequency channel is used to highlight the channel characteristics of multi-scale context information.Finally,the image features are enhanced from both dynamic and static depth through the cross-cue fusion (CCF) module to improve the dynamic information processing and detail capture capabilities.When tested on the datasets CVC-ClinicDB,Kvasir,CVC-ColonDB,and ETIS-LaribPolypDB,Dice indices are 0.942,0.924,0.800 and 0.774,respectively.The MIoU indices are 0.896,0.878,0.726 and 0.697,respectively.The experimental data show that the proposed method can effectively segment colorectal polyp images and provide a new idea for the diagnosis of colorectal polyp.

    参考文献
    相似文献
    引证文献
引用本文

梁礼明,李俞霖,金家新,何安军,夏雨辰.融合Transformer和线索交叉聚合的结直肠息肉分割方法[J].光电子激光,2025,(2):136~145

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2023-07-05
  • 最后修改日期:
  • 录用日期:
  • 在线发布日期: 2024-12-27
  • 出版日期:
文章二维码