稿件标题: | 基于自注意力与多粒度卷积的文本识别方法 |
稿件作者: | 崔立志1,2,李俊1,2 |
DOI: | 10.11809/bqzbgcxb2023.S1.052 |
栏目名称: | 信息科学与控制工程 |
关键词: | 文本形态;多粒度;Transformer;混合注意力;自注意力 |
文章摘要: | 针对自然场景中文本形态差异大,背景纹理复杂等问题,提出一种多粒度卷积神经网络联合自注意力的文本检测与识别方法。设计ResNetT的模型框架用于抽取多尺度特征,该框架综合Transformer的结构优点以及卷积神经网络的性能特点,在不增加计算量的同时提升原本映射强度,增强信息的捕获能力;根据高分辨率文本图像具有间距小、纹理复杂的特点,设计混合注意力(shuffle attention,SA)解决噪声影响以及小目标丢失等问题;以自注意力机制为时序分类编码器对特征序列预测,建立字符序列与视觉感知的联系。在公开数据集上进行实验研究,结果表明,所提方法能够克服文本形态等因素的影响,实现复杂背景下文本分割与识别,在Icdar2015数据集的检测与识别的准确率达到90.2%。 |
稿件基金: | 国家自然科学基金项目(U1804147);河南理工大学教改项目(2019JG033) |
引用本文格式: | 崔立志,李俊.基于自注意力与多粒度卷积的文本识别方法[J].兵器装备工程学报,2023,44(S1):300-306. CUI Lizhi, LI Jun.Text recognition method based on selfattention and multigranularity convolution[J].Journal of Ordnance Equipment Engineering,2023,44(S1):300-306. |
刊期名称: | 2023年增刊1期 |
出版时间: | 2023年8月 |
上线时间: | 2023年8月5日 |
浏览次数: | 1313 |
下载次数: | 42 |
免费阅读PDF 下载本期目录 下载本期封面 |