兵器装备工程学报

文章详情

稿件标题: 基于自注意力与多粒度卷积的文本识别方法
稿件作者: 崔立志1,2,李俊1,2
DOI: 10.11809/bqzbgcxb2023.S1.052
栏目名称: 信息科学与控制工程
关键词: 文本形态;多粒度;Transformer;混合注意力;自注意力
文章摘要: 针对自然场景中文本形态差异大,背景纹理复杂等问题,提出一种多粒度卷积神经网络联合自注意力的文本检测与识别方法。设计ResNetT的模型框架用于抽取多尺度特征,该框架综合Transformer的结构优点以及卷积神经网络的性能特点,在不增加计算量的同时提升原本映射强度,增强信息的捕获能力;根据高分辨率文本图像具有间距小、纹理复杂的特点,设计混合注意力(shuffle attention,SA)解决噪声影响以及小目标丢失等问题;以自注意力机制为时序分类编码器对特征序列预测,建立字符序列与视觉感知的联系。在公开数据集上进行实验研究,结果表明,所提方法能够克服文本形态等因素的影响,实现复杂背景下文本分割与识别,在Icdar2015数据集的检测与识别的准确率达到90.2%。
稿件基金: 国家自然科学基金项目(U1804147);河南理工大学教改项目(2019JG033)
引用本文格式: 崔立志,李俊.基于自注意力与多粒度卷积的文本识别方法[J].兵器装备工程学报,2023,44(S1):300-306.
CUI Lizhi, LI Jun.Text recognition method based on selfattention and multigranularity convolution[J].Journal of Ordnance Equipment Engineering,2023,44(S1):300-306.
刊期名称: 2023年增刊1期
出版时间: 2023年8月
上线时间: 2023年8月5日
浏览次数: 1313
下载次数: 42
免费阅读PDF 下载本期目录 下载本期封面