智能光电检测技术专栏
目前军事,生活中常用的光电装备由于其光学系统对入射光线有很强的原路返回特性,这种特性称为“猫眼”效应[1],具有该效应的光电目标称为猫眼目标。猫眼目标识别是一个重要的问题,其广泛应用于无源光学系统的识别[2],目前在反侦察、反狙击、酒店反窃视等安保应用领域中都发挥着很重要的作用。在复杂场景中检测猫眼目标存在着诸多难点,如行人走动、背景变化、光照变化等,使得背景中存在大量噪声,这种情形下检测猫眼目标十分困难,误报率很高。国内外针对这一技术难题进行了大量研究与探索。
目前,利用激光主动探测技术[3]识别猫眼目标是热门的研究领域,也是主要探测手段之一。相比国内,国外在此领域研究起步很早,已经研制了多种成熟的光电探测设备。如英国研制的ELLIPSE反狙击手激光检测设备,法国的SLD系列的狙击手探测装置。在国内,同兰娟等[4]根据猫眼目标的特征提出基于圆度和偏心度识别方法;李丽等[5,-6]提出的猫眼目标快速识别方法与任熙明[7]等人提出的形频对偶准则方法相比虽然提高了算法速度,减少了算法所需的图像数量,但识别速度仍然比较长。针对复杂场景的识别问题,王兴宾等[8]提出的基于视觉显著性的猫眼目标识别方法与王喆堃等[9]提出的基于OFSD配准算法的猫眼目标识别方法在算法速度和精度上有所提升,但都只能识别一个真实目标。基于传统的图像处理算法识别猫眼目标有其局限性,在算法精度和速度上难以平衡。随着近年来深度学习的不断完善发展,陆续有学者使用卷积神经网络来检测猫眼目标,如柯学[10]结合了机器学习和深度学习方法识别隐蔽相机,Liu等[11]提出利用分类网络检测室内微型相机,但是他们在检测速度和检测距离上有所缺陷难以得到应用。关键问题是由于猫眼目标在图像中所占像素过少的原因,仅利用深度学习目标检测算法[12]识别猫眼目标效果较差,而传统图像处理算法由于其局限性又难以兼并速度与精度。如何在复杂环境下准确剔除假目标,并快速稳定识别真实目标是一个急需解决的问题。
因此针对上述问题,本文中利用了猫眼目标的显著性特征与孪生网络的相似性检测原理,通过传统图像处理方法与深度学习方法相结合的思路提升算法精度与检测速度。相比于传统图像处理方法,该方法大大减少了检测时间,同时也提升了识别准确率,该方法可满足实际复杂场景中的实时性检测。
本文算法流程如图1所示。先对主被动图像进行图像预处理得到差分图像,然后使用显著性检测方法来增强差分图像中的猫眼目标;通过阈值分割在显著图中找出候选区域并将该区域返回差分图像,对其候选区域使用综合形状度量值进一步判别得到候选目标区域;最后,利用本文中改进的基于SKNet21的孪生网络对差分图像中的候选目标区域进行猫眼目标识别,提取真实的猫眼目标。
孪生网络[13]简单来说,是用神经网络来判别2个输入的相似程度,输出为相似度数值。例如它将2个图像分别输入到2个卷积神经网络中,通过Loss的计算,可以比较出2个图像的相似程度。对于猫眼目标识别任务来说,计算图像中候选目标区域与猫眼目标的相似程度可以判断该区域是否为真实目标,这与传统的猫眼目标识别问题类似,为解决猫眼目标识别问题提供了新的思路与途径。
图1 本文算法流程框图
Fig.1 Algorithm flowchart of the proposed
本文中采用的网络模块结构如图2所示[14],该网络借鉴了一种改进的残差网络,即SKNet[14]。其模型可以根据输入信息的多尺度自适应地调整感受野的大小并选择对分类有效的感受野捕捉到的信息。
图2 SKNet模块结构示意图
Fig.2 The SKNet module
SKNet模块的Split操作是将输入X分别通过3×3的分组卷积和感受野为5×5的空洞卷积并生成2组不同的特征图在Fuse阶段,这两组特征图融合生成U,经自适应全局平均池化后生成大小为1×1×C的特征图S,S经过2个全连接层后生成d×1的向量Z,经 Softmax函数后Z被分成2个权重不同的a和b,其中a与b的值之和为1。2组特征图分别与得到的a和b相乘。Select阶段,将这2组加权后的特征图进行融合得到输出特征V。表1为本文孪生网络构成的SKNet21网络结构,其中M为Split的分支数,r为缩小的比率,L表示d的最小取值,在实验过程中,为了算法处理速度与检测性能均衡,模型推理速度更快,本文中在构建网络时,SKConv模块中M的值为2,L的值为32,r的值为2。SKConv模块的输出包含不同的感受野组合,这极大增强了特征信息的表示。因此,不同感受野得到的特征信息能够扩大神经元的感知范围,更有利于网络对猫眼目标和背景杂波进行区分以及对不同大小的猫眼目标有很好的识别效果。
表1 SKNet21网络结构
Table 1 SKNet21 network structure
输入大小网络结构个数105×105[3×3,16]×1[3×3,16]×1[3×3,32]×1152×52[1×1,32]×1SKConv模块[M=2,r=16,L=32][1×1,64]×1226×26[1×1,64]×1SKConv模块[M=2,r=16,L=32][1×1,128]×1213×13[1×1,128]×1SKConv模块[M=2,r=16,L=32][1×1,256]×123×3[1×1,256]×1SKConv模块[M=2,r=16,L=32][1×1,512]×12Flatten,512×3×3
为了达到算法处理的快速高效,同时降低网络参数与计算量,本文中将SKNet模块构建成21层,即SKNet21,孪生网络结构如图3所示。网络采用3通道的候选目标区域作为输入,输入大小为105×105,经过2个SKNet21网络后,将得到的2个多维特征展开成一维向量,将这2个一维向量进行相减再进行绝对值求和,相当于求取了2个特征向量插值的L1范数。接着对其结果进行2次全连接,全连接的输出为一个神经元,最后对其结果取Sigmoid,使其值在0~1,代表2个输入图片的相似程度。网络预测推理时,输入X1与X2分别是猫眼目标样本与差分图像中的候选目标区域。
图3 本文孪生网络结构框图
Fig.3 The proposed siamese network structure
为了尽可能消除图像噪声,需对实验采集的原始主动和被动图像进行形态学处理,而Tophat变换可以起到抑制背景且增强目标的作用。由于猫眼目标的形状并不是严格的圆形结构,因此本文中进行形态学处理时选取椭圆形状的结构元素。
设经预处理后的主被动图像分别为I1和I2,其灰度图像尺寸大小为M×N,设Iave是主动图像与被动图像的平均灰度差[6],如式(1)所示:
(1)
采用图像差分方法消除主被动图像的背景平均灰度差过大的影响,图像差分运算如下式:
Isub=I1-(I2+Iave)
(2)
差分图像中存在少许的虚警点,这些虚警点主要来自于图像背景中的斑点状强噪声和强边缘特征。因此,为了抑制这些难以去除的虚警,降低其对猫眼目标识别的影响,有必要引入图像显著性特征检测。由于图像背景复杂多样,但经过图像差分后的猫眼目标在图像里非常显著,即猫眼目标与局部邻域之间具有较高的对比度,从而具备显著性。
在众多的显著性检测方法中,光谱残差[15](spectral residual,SR)方法具有较低的计算复杂度,无需先验知识就能进行显著性检测。SR方法可以很好的滤除背景中的冗余,保留并突显目标。因此,该方法能使猫眼目标在图像中得到进一步增强,本文中简要表示采用PFT计算[8]显著性区域的过程,公式如下:
A(f)=R(F[I(x,y)])
(3)
P(f)=I(F[I(x,y)])
(4)
L=log(A(f))
(5)
R(f)=L(f)-L(f)*hn(f)
(6)
S(x,y)=g(x,y)*F-1[exp(R(f)+P(f))]2
(7)
式中,I(x,y)表示差分图像,F[·]和F-1[·]分别为傅里叶变换和傅里叶逆变换,R和I分别是取傅里叶变换的振幅和相位,A(f)和P(f)分别为幅值和相位,L(f)为幅值A(f)的对数谱,R(f)为谱残差,hn(f)和g(x,y)分别为二维的均值滤波器和高斯低通滤波器(σ=1.5),为了突显及保留目标的形状轮廓,其滤波器大小分别为3×3和5×5,S为显著图。
在得到显著图后,先对显著性区域进行粗检测。为了防止阈值过高导致候选区域出现过度分割、猫眼目标特征不明显的情况,将阈值设置为160,该阈值也能减少后续识别的可疑区域。最后,把以粗候选区域为中心的20×20区域作为候选区域。对于猫眼目标来说,仅是判断灰度值是否足够大还不够,还要看其候选区域是否符合猫眼目标的其他光学特性。除了猫眼目标的亮度特性外,反射光斑的形状也具有鲜明的特征。它在图像中的表现为实心且近似圆形,可以依据反射光斑的这种形状特征判别真实目标。猫眼目标的形状特征选取综合形状度量值作为判别准则,只需对显著图中的全部候选区域进行圆形度的计算,计算时间增加很少,可忽略不计。本文圆形度[16]的计算公式如下:
(8)
式中,D为等效直径,是面积与轮廓面积相等的圆的直径,Area为轮廓的面积,其中,D的计算公式如下:
(9)
则本文综合形状度量值Mc的计算公式如下:
MC=|C-1|
(10)
当候选区域中的轮廓形状为理想的圆形时,综合形状度量值的理想值应为0。经实验证明,在计算时,MC的值应设为0.30,小于等于该值即可视为是候选目标区域。最后,使用本文提出的孪生网络对差分图像中的候选目标区域判别,提取真实猫眼目标。
对每次实验采集到的每个场景的猫眼目标区域进行裁剪,裁剪的目标图像总数为6 850,同时也在所有主动图像中裁剪出各种虚假目标样本图像13 000张,裁剪大小为20×20。为了丰富数据样本,根据猫眼目标的特性构建猫眼目标样本,在所有场景的被动图像中随机裁剪出大小为20×20的背景图像用以构造猫眼目标图像,为了使构造的目标图像更具真实性,限定了裁剪的背景图像的平均灰度,范围在[80,120]。当目标与成像探测器距离较远时,其辐射特性接近一个点源,在图像中呈类高斯状,可以用一个二维高斯函数来模拟,如式(11)所示:
(11)
其中: Imax表示猫眼目标邻域的灰度峰值,和表示水平方向和垂直方向的方差,(x0,y0)表示猫眼目标邻域的中心点坐标,(x,y)表示邻域内的像素坐标。上述的二维高斯函数并不能很好的仿真出真实的猫眼目标,对于不同距离下的猫眼目标,大小应该具有差别,因此其相关参数[17]应该相互制约。经实验,本文中σx和σy的取值范围为[1.25,4.75]。根据式(11)构造了6 150张猫眼目标图像,输入网络时的图像大小为105×105,部分仿真图像及裁剪图像如图4所示。
图4 部分猫眼目标图像
Fig.4 Part of the cat’s eye target image
搭建了文献[6]的猫眼目标探测激光成像系统采集主被动图像。图5为探测系统结构框图,其中包括一个CCD工业相机,一个波长为532 nm的激光器,工业相机所采集的图像尺寸大小为640×480。利用构建的猫眼目标数据集对网络进行训练,数据集总共26 000张图像,包含猫眼目标图像和虚假目标图像,随机选取20 800张作为训练集,5 200张作为测试集。实验使用开源框架pytorch构建基于SKNet21的孪生网络,实验环境是Inter(R)Core(TM)i7-9700F CPU@3.00 GHz,GPU内存为12GB 的GTX TITIAN XP,系统内存为64GB的Windows10操作系统。网络训练采用带动量的SGD优化器,交叉熵损失函数BCELoss,动量设置为0.9,初始学习率设为0.001,每隔10代下降到原来的0.92,每次学习的训练样本为30,总共迭代80代。训练结束后,将评估结果最好的一次作为最终模型保存。实验测试平台为Windows10操作系统,CPU为Inter(R)Core(TM)i5-7300U CPU@2.71 GHz,运行内存为8 GB的笔记本电脑。
图5 猫眼目标激光成像探测系统结构框图
Fig.5 Thecat-eye target detection laser imaging system
准确率Pd和虚警率Pf是评估猫眼目标识别方法性能的重要指标,用于评价算法的检测能力,二者定义为:
(12)
式中: Nd表示检测到的真实目标数量,Nt表示所有真实目标的总数,Na表示检测到的虚假目标数量,Nr表示所有测试图像中检出目标的总数。
使用本文方法对原始图像预处理的实验结果如图6所示,图6(a)中的猫眼目标用红色方框标记。从图中可以观察出,经过预处理后,图6(b)中的猫眼目标相对于背景来说仍然显著,而图中大部分背景已经被抑制,其背景灰度值很低。这说明了使用图像预处理能很好的增大猫眼目标的对比度,同时有效减少了一些假目标区域。
图6 图像预处理实验结果
Fig.6 Image preprocessing experiment results
为了评估图像显著性检测机制在本文算法中的作用,在有无显著性检测方法的情况下对本文算法的检测性能进行了评估。
检测性能参数如表2所示,结果表明,在不含显著性检测方法下,检测率和误报率都更高。这是由于猫眼目标特征判别时容易将差分图像中的斑点状强噪声和强边缘特征等误识别为猫眼目标进而造成虚警,而显著性检测方法有利于对这些虚警进行有效抑制。显著性检测结果如图7(b)所示,从图中可以看出,猫眼目标在图像中被显著增强,同时背景被有效抑制,这说明本文方法的有效性。
表2 有无显著性检测时的检测性能参数
Table 2 Comparison of detection performance with or without saliency detection
方法误报率/%准确率/%有显著性检测1.5498.05无显著性检测4.6231.17
为了验证本文网络中SKNet模块相比其他模块的优劣,实验中选择了ResNet[18]、SENet[19]、以及Res2Net[20]一共3个模块,并分别构建相对应的孪生网络进行训练,将保存下来的模型结合本文所提的识别方法分别对260帧主被动图像进行测试,并分别比较其准确率、误报率以及运行速度和模型大小。
图7 显著性检测结果图
Fig.7 Saliency detection result
检测性能参数如表3所示,从表3可看出,虽然SE-ResNet21网络的检测率很高,但是它的检测时间最长且模型最大,并不适合实时性检测和模型部署应用,而本文采用的SKNet21对于猫眼目标的检测性能较好,在保证高检测率的同时模型最小,运行速度最快,误报率最低,其各方面表现都较好。
表3 不同网络结构的检测性能参数
Table 3 Comparison of detection performance of different networks
方法误报率/%准确率/%耗时/s模型大小/MBResNet213.0797.400.4127.6Res2Net2115.497.400.4615.3SE-ResNet213.0799.352.052.1SKNet21(本文方法)1.5498.050.2612.9
为了测试所提出方法的检测性能,对所提方法进行验证,并与文献[8]方法进行了比较。实验的图像是在2种不同条件的典型场景下采集的。在猫眼目标附近增加了具有高反射率的贴纸作为干扰并随猫眼目标一起被激光照射,所有图片均在早上、中午和黄昏拍摄的,检测设备与目标之间的距离在2个场景的距离分别约为80 m和130 m。
本文方法与文献[8]方法的检测结果如图8所示,图8(a1)和图8(a2)是在不同背景下,其中图8(a2)是在动态背景下。2个场景分别是在树林中和有行人和汽车的过道上,其中(a1)(a2)是2幅含有猫眼目标的原始主动图像,(b1)(b2)是基于本文方法的目标识别结果图,(c1)(c2)是基于文献[8]方法的目标识别结果图,红色矩形框标记的为最后识别出来的目标。
从图8(c1)(c2)中可以看出,在无法完全滤除干扰目标时,文献[8]的方法无法正确识别出猫眼目标,而且在图像中出现2个猫眼目标时,该方法只能识别出一个目标;通过图8(b1)可以看出,本文提出的方法不仅能滤除掉绝大部分的虚假目标,且对于无法去除的高反射率的虚假目标,通过猫眼目标特征判别以及本文提出的孪生网络可以很好地识别出真实猫眼目标。图8(b2)的结果说明了本文方法不仅可以很准确识别动态背景下的真实目标,而且能识别场景中的多个目标。
图8 本文方法与文献[8]方法检测结果图
Fig.8 Comparison results between Ref.[8]and our method
为了定量评价,进一步证明本文方法的优越性,选取了260张主被动图像帧序列进行测试。将本文方法与文献[8]方法以及文献[12]的方法进行检测性能对比,如表4所示。结果表明,本文方法能在复杂场景下具有更高的准确率和较低的误报率,而测试多轮该图像帧序列后,在2张主被动图像的处理上平均用时约为0.26 s,远快于文献[8]方法。此外,从表4中可看出本文方法也比文献[12]90.37%的准确率要高。
表4 3种方法的检测性能参数
Table 4 Comparison of detection performance of the three methods
方法误报率/%准确率/%耗时/s本文方法3.0798.030.26文献[8]方法1.2196.701.92文献[12]方法-90.370.024
本文提出并验证了基于孪生网络与视觉显著性的猫眼目标识别方法,主要包括图像预处理、显著性检测与孪生网络判别等步骤。实验结果表明,本文方法能有效对背景进行抑制,使用孪生网络能排除图像中的高反射率虚假目标,本文方法准确率较高,在复杂环境中能够准确识别出多个猫眼目标,识别速度更快,能够满足实时性要求。本文方法将猫眼目标识别问题与孪生网络联系在一起,提供了新的思路与途径,也克服了在激光主动探测系统中使用深度学习方法的局限性。在未来研究中,可以针对硬件部署对网络结构与算法进行优化设计,并可以就卷积神经网络与传统检测算法的结合展开研究。
[1] 孙华燕,张来线,赵延仲,等.逆向调制自由空间激光通信技术研究进展[J].激光与光电子学进展,2013,50(04):040004.
Sun H Y,Zhang L X,Zhao Y Z,et al.Progress of free-spaceoptical communication technology based on modulating retro-reflector[J].Laser & Optoelectronics Progress,2013,50(04):040004.
[2] Zhao Y Z,Sun H Y,Xia Y Q,et al.Three-dimensional analytical formula foroblique and off-axis gaussian beams propagating through a cat-eye optical lens[J].Chinese Physics Letters,2010,27(03):034101.
[3] 李帅,孙华燕,赵延仲.基于光电目标的激光外差探测系统信噪比分析[J].兵器装备工程学报,2018(03):178-181.
Li S,Sun H Y,Zhao Y Z.SNR analysis of laser heterodyne detection system based on electro optical target[J].Journal of Ordnance Equipment Engineering,2018(03):178-181.
[4] 同兰娟,蒋晓瑜,宋小杉,等.基于“猫眼效应”激光成像的目标探测[J].激光与红外,2009,39(09):982-985.
Tong L J,Jiang X Y,Song X S,et al.Target detection based on laser imaging with “cat eye effect”,Laser & Infrared,2009,39:982-985.
[5] Li L,Ren J,Wang X.Fast cat-eye effect target recognition based on saliency extraction[J].Optics Communications,2015,350:33-39.
[6] 杨岳青,李丽.基于局部特征的猫眼效应目标识别方法[J].激光与红外,2015(05):580-583.
Yang Y Q,Li L.Method of cat-eye effect target recognition based on local features[J].Laser & Infrared,2015,(05):580-583.
[7] Ren X M,Li L.Recognizing cat-eye targets with dual criterions of shape and modulation frequency[J].Chinese Optics Letters,2011,9(04):38-41.
[8] Wang X,Jun Z,Wang S.The cat-eye effect target recognition method based on visual attention[J].Chinese Journal of Electronics,2019,28(05).
[9] 王喆堃,朱精果,姜成昊,等.动态环境下“猫眼”目标快速识别算法研究[J].计算机仿真,2020,37(08):414-418.
Wang Z K,Zhu J G,Jiang C H,et al.“Cat’s Eye” target quickly recognition algorithm research in dynamic environment[J].Computer Simulation,2020,37(08):414-418.
[10]柯学.基于机器视觉的隐蔽摄像头检测与识别方法研究[D].武汉:华中科技大学,2019.
Ke X.Research on hidden camera detection and recognization method based on machine vision[D].Wuhan:Huazhong University of Science and Technology,2019.
[11]Liu C,Zhao C M,Zhang H Y,et al.Design of an active laser mini-camera detection system using CNN[J].IEEE Photonics Journal,2019,11(6):1.
[12]HUANG J H,ZHANG H Y,WANG L,et al.Improved YOLOv3 Model for miniature camera detection[J].Optics and Laser Technology,2021,142.
[13]Chopra S,Hadsell R,Lecun Y.Learning a Similarity Metric Discriminatively,with Application to Face Verification[C]//null.IEEE Computer Society,2005.
[14]Li X,Wang W,Hu X,et al.Selective kernel networks[C]//2019 IEEE/CVF Conference on Computer Vision and Pattern Recognition(CVPR).IEEE,2020.
[15]Hou X,Zhang L.Saliency detection:A spectral residual approach[C]//IEEE Computer Society Conference on Computer Vision & Pattern Recognition.IEEE,2007.
[16]Feng Q,Bao Z,Yin C,et al.Recognition of interior photoelectric devices by using dual criteria of shape and local texture[J].Optical Engineering,2015,54(12):123110.
[17]李梦莹.复杂背景下的红外小目标检测算法研究[D].长春:吉林大学,2018.
Li M Y.Research on infrared small target detection under various complex backgrounds[D].Changchun:Jilin University,2018.
[18]He K,Zhang X,Ren S,et al.Deep residual learning for image recognition[J].IEEE,2016.
[19]Jie H,Li S,Gang S,et al.Squeeze-and-excitation networks[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2017(99).
[20]Gao S,Cheng M M,Zhao K,et al.Res2Net:A new multi-scale backbone architecture[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2019(99):1.