随着航天技术在国家安全、经济、社会服务和军事等众多领域的广泛应用,人类对太空的依赖性日益增强,太空已成为维护国家安全和国家利益的战略制高点[1]。世界各航天强国纷纷致力于推动航天发射任务和太空武器建设,试图抢占有限的太空资源。由此引发了太空目标数量呈指数级的增长和太空武器技术呈多样化的发展,给预警监视任务中雷达组网有限的资源调配带来了严峻挑战。截至2021年底,地球上空已有超过4900颗卫星、空间站、航天飞船等航天器保持稳定在轨运行。预计到2028年,随着“星链”(starlink)、“一网”(oneweb)等全球大量低轨互联网通信卫星星座完成发射部署,地球太空轨道上将有超过50 000颗卫星[2-4]。与此同时,临近空间飞行器、高超音速导弹等一系列新型太空武器也相继问世。基于经验、半经验模型的雷达组网人工资源调度方法已难以与日益繁重的预警监视任务相适应。
针对当前预警监视任务中雷达组网资源调度方法难以与太空目标数量井喷式增长、太空武器多样化发展的趋势相适应的问题,基于人工智能算法,面向反导预警和空间目标监视2类任务开展雷达组网资源调度方法研究,合理调配系统资源,充分发挥雷达组网探测效能,推动系统向自主任务处理、自动目标分配与自适应指挥控制方向发展,可为提高预警监视能力建设水平和战斗力生成发挥重要技术支撑作用。
预警监视雷达组网作为预警监视系统的主体部分,集“战略预警”与“天域感知”于一体,利用系统中多种类型的专用装备和兼用装备构建预警监视网,在反导预警和空间目标监视作战任务中对目标进行跟踪探测,通过各传感器节点间的信息共享实现“一点发现、全网皆知”,是国家遂行战略安全任务的“压舱石”与“制高点”。预警监视雷达组网的工作效能在很大程度上取决于对组网内各雷达有限探测资源的合理分配调度。同时,在“陆、海、空、天、电”五位一体的现代高技术局部战争中,诸如电磁干扰、反辐射导弹等作战手段都给预警监视雷达组网中装备的生存带来了极大威胁。因此,对预警监视雷达组网内资源的合理调度,对于提升系统效能和鲁棒性具有极其重要的意义。
面向预警监视任务的雷达组网资源调度,是在满足任务需求和约束条件的基础上,通过对其所包含探测资源在时间维度上的合理调度[5],优化目标分配排序作业方案,以实现对预警监视目标更加精准高效探测的过程。而以最优资源调度为目标的探测任务旨在资源受限的条件下尽可能地提高协同探测性能,或在满足任务需求情况下尽可能地降低系统资源消耗[6],由此带来资源调度问题场景复杂、计算量大、精度要求高的特性[1]。
1.2.1 反导预警任务中的资源调度原则
反导预警任务是指在面临来袭的弹道导弹目标时,根据探测后计算得到的导弹运动参数预测导弹的飞行弹道与时序,为我方开展相应防御行动提供预警时间以避免或减小遇袭损失,同时指示弹道导弹防御系统对其进行拦截的一类作战任务,主要由反导预警系统负责实施[7]。
反导预警任务的最终目的是对来袭导弹发出预警,从而开展防御拦截行动。因此,预警力量将更多地关注投入到具有实质性威胁的弹头目标上,同时对系统的目标截获能力提出了很高的要求,确保威胁目标在波束扫描过程中不被漏掉。通常情况下,预警雷达会根据任务需要设立搜索屏,在目标穿屏时将其截获,也会通过增设搜索屏的方式提高系统的目标截获能力。反导预警任务中,雷达组网将尽可能掌握威胁目标和提高目标截获概率作为其资源调度的原则。
1.2.2 空间目标监视任务中的资源调度原则
空间目标监视任务是指利用雷达等探测设备对所有人造天体进入、离开空间以及在空间中运行的过程进行探测,并据此结合相关太空目标情报资料,综合处理分析出目标轨道、功能、威胁等基本信息,生成全要素的空间态势,以向各类航天活动提供有效信息支持的一类作战任务[8]。其主要特点是探测活动的非合作性、信息要素的完备性以及监视过程的长期性等。
空间目标监视任务旨在监视空间目标在轨状态,通过获取的轨道信息生成全要素的空间态势。因此,监视力量需要以较高的测量精度对目标精确定轨,将其作为识别编目工作的依据。空间目标监视任务中,雷达组网将保证雷达对目标的测量精度作为其资源调度的原则。
实战条件下的预警监视雷达组网往往承担着预警与监视2个类别中的多项作战任务。当面临多个任务冲突时,需要依据任务的优先级给出雷达组网有限资源的调配建议,供指挥员决策参考,最终制定生成一套全局作战方案,确保投入的作战力量与任务的优先级成正比。为了更加科学、合理地对任务进行评估,采用层次分析法对任务优先级进行划分。
基于层次分析法的任务优先级划分将任务优先级作为目标层;将任务重要程度、任务紧急程度、先验情报完备程度以及作战决心作为准则层;将待划分的各作战任务(以3个任务为例)作为方案层,构建递阶层次结构模型,如图1所示。
图1 递阶层次结构模型
Fig.1 Hierarchical structure model
模型将复杂问题分解为多个组成因素便于分析,分析过程中以相对重要程度为依据,采用两两比较的方式构造判断矩阵An*n,其中元素aij表示该层次中对象Bi与对象Bj基于上一层次的重要程度之比,aji=1/aij,取值采用1~9标度法表示,并通过计算一致性指标C.I.和一致性比率C.R.检验判断矩阵的一致性。
在构造判断矩阵的基础上,运用特征值法求得本层次各对象相对于上一层次的权重系数,填充权重矩阵,如表1所示。由任务优先级的计算公式计算各作战任务的任务优先级OPi,并按照从大到小的顺序进行任务优先排序[9]。
表1 任务优先级权重矩阵
Table 1 Taskpriority weight matrix
指标指标权重作战任务1作战任务2作战任务3任务重要程度wC1wC11wC12wC13任务紧急程度wC2wC21wC22wC23先验情报完备程度wC3wC31wC32wC33作战决心wC4wC41wC42wC43
OPi=wC1wC1i+wC2wC2i+wC3wC3i+wC4wC4i
(4)
假设预警监视雷达组网由N部雷达组成,在K个单位作战时间内对M个目标进行协同探测,在满足充分利用探测资源的条件下,尽可能实现探测目标价值累积与跟踪质量最大化。定义三维分配矩阵Xm*n*k,表示各时刻雷达对目标探测的跟踪资源分配,如图2所示,同一目标的跟踪情况用同一颜色表示,其中元素xijt为0-1变量。当xijt=1时,表示t时刻分配第j部雷达资源对第i个目标进行跟踪探测[10],否则xijt=0。
图2 三维分配矩阵示意图
Fig.2 Three dimensional distribution matrix
N部雷达具有不同的跟踪测量精度pj和探测容量cj,M个目标依据价值不同被赋予不同价值等级wi。用tij0、tijs分别表示第i个目标进入和飞出第j部雷达探测范围的时刻,其差值为第i个目标在第j部雷达探测范围内的驻留时间tij。
tij=tijs-tij0
(5)
当目标进入雷达探测范围,雷达对目标进行搜索,截获方向与雷达阵面法线方向之间存在波束指向角eij[11]。雷达天线在不同波束指向角条件下用于发射/接收能量的等效口径面积不同,因而雷达波束的能量大小也不同,直接影响雷达对目标的搜索截获及探测效果,如图3所示,天线等效口径面积As为法线方向时面积A在等相面上的投影。随着波束指向角增大,天线等效口径面积减小,天线增益随之下降,等效天线方向用于搜索截获目标的雷达波束能量相应减弱。
图3 波束指向角对天线等效口径面积的影响
Fig.3 Effect of beam pointing angle on equivalent aperture area of antenna
由此可得目标函数:
式中,K1、K2、K3分别为对目标价值等级、雷达测量精度、波束指向能量的赋权值。依据不同任务场景及用户需求灵活取值,表示对影响目标跟踪探测效能3个因素的不同看重程度。
在反导预警和空间目标监视2类任务场景中,探测任务对预警监视雷达组网的目标跟踪探测提出了不同的需求,且任务对象具有不同特性,由此带来2类任务场景下模型参数的不同配置。
在反导预警任务中,弹道导弹目标作为任务对象,包括弹头、弹体、诱饵、碎片等多类目标,且在飞行过程中呈多组团目标分布,每组团目标中主体目标周围有若干伴飞物[12],各目标依据威胁程度不同被赋予不同威胁等级,即价值等级wi。雷达在对团目标进行探测时,由于团目标内各目标间距离相对于探测距离而言可以小到忽略不计,因此近似认为同一团目标内各目标均在tij0和tijs时刻进入和飞出雷达探测范围,即驻留时间tij相同。反导作战的特殊性决定了预警监视雷达组网的“不容闪失”,首要任务就是预警来袭的弹头目标,及时截获并传递信息给拦截武器,以清除对我防卫目标的威胁。因此模型目标函数应更加关注目标威胁程度和搜索截获能力带来的影响,适当增加目标价值等级和波束指向能量在目标函数中的权重,使K1、K3高于K2。
在空间目标监视任务中,空间目标飞行在大气层以外的外层空间,距离探测雷达很远,而精确定轨是进一步开展识别编目的前提条件,从而对预警监视雷达组网的测量精度提出了很高的要求[13]。同时,空间目标监视任务为监视活动,旨在监视目标在轨状态,目标不存在直接威胁,仅依据关注程度划分价值等级。因此模型目标函数应更加关注测量精度带来的影响,弱化对目标价值的区分和截获时效性,适当增加雷达测量精度在目标函数中的权重,使K2高于K1、K3。
2.3.1 时间约束
在反导预警任务场景中,远程预警雷达跟踪探测目标后引导交接给精确识别雷达,最终生成火力拦截引导信息。拦截武器具有安全近界,需要目标在安全近界之外进行火力拦截才有效,同时远程预警雷达需要一定时长生成引导信息并向后传递。因此雷达的有效探测受限于一个时间约束的距离区间,包括一个近界和一个远界,近界为预警截止时间tijl带来的约束,远界为雷达最大探测距离,受到目标进入雷达探测范围时刻tij0的约束。
xijt=0 ⟸ t∈(0,tij0)∪(tijl,∞), ∀i, j
(7)
在空间目标监视任务场景中,雷达对目标的探测目的为监视目标在轨状态,不需要向拦截武器传递信息,仅受限于目标进入和飞出雷达探测范围的时刻tij0、tijs。
xijt=0 ⟸ t∈(0,tij0)∪(tijs,∞), ∀i, j
(8)
2.3.2 方向约束
执行预警监视任务的相控阵雷达由大量独立可控的小型天线元件构成其天线阵面,包含多个阵元。雷达可通过计算机系统控制各阵元电流的相位,以达到改变波束扫描方向的目的,阵元数目越多,则波束扫描方位的范围就越大[14]。而预警监视雷达组网中部分相控阵雷达阵面固定,不具备随动功能,受限于旁瓣能量衰减和阵元数目有限,仅能够在与雷达阵面法线一定夹角范围内进行有效探测,即存在方位约束角θ。该约束仅取决于雷达装备性能,在反导预警与空间目标监视任务场景下均成立。
xijt=0 ⟸ eij>θ, ∀i, j,t
(9)
2.3.3 容量约束
雷达同一时刻可探测的目标数量受限于装备的探测容量,表现为预警监视系统探测资源的饱和。该约束仅取决于雷达装备性能,在反导预警与空间目标监视任务场景下均成立。
2.3.4 冗余约束
在预警监视雷达组网探测过程中,多部雷达共同探测同一目标可通过融合手段有效提升协同探测整体效果,并增强系统的鲁棒性,但过多的重复探测则会造成探测资源的浪费,形成目标占用冗余。通常认为2~3部雷达共同探测较为合理,多于3部雷达重复探测则属于资源浪费,违背了充分利用跟踪探测资源的初衷。该约束仅取决于提高资源利用率原则,在反导预警与空间目标监视任务场景下均成立。
2.3.5 连续性约束
在反导预警任务场景中,目标被划分为多组团目标,团目标内各目标间距离相近,区分难度大。为保证目标跟踪的连续性,避免因雷达频繁交接而带来时空配准偏差,最终导致目标交叉匹配错误,因此在跟踪探测目标过程中需要尽可能减少雷达间交接。当一个雷达资源被分配对目标i进行跟踪探测,则自此时刻起,该雷达保持对目标i的持续探测,直至无法对目标i进行有效探测,不在中途向其他雷达交接。
在空间目标监视任务场景中,目标独立在轨运行,不存在团目标内目标交叉匹配错误的问题,且目标运动遵循开普勒定律,轨迹相对稳定,不受雷达交接频次的限制。而雷达通过对空间目标飞行轨迹中一个弧段的跟踪探测,多次取样获取不同时刻的目标位置信息,从而计算轨道参数,取样次数越多,定轨精度就越高。为满足空间目标监视定轨精度的要求,需要对每部雷达限制最小连续探测时长,用于生成有效监视弧段。因此,雷达对目标的连续探测时长不得小于有效监视弧段时长tmin[15]。
3.1 基础算法概述
3.1.1 模拟退火算法
模拟退火算法(simulated annealing,SA)是一种基于概率的随机全局优化算法,其基本思想源于对物理学中固体物质冷却退火过程的模拟。模拟退火过程中,处于高温的固体物质内能极大,内部分子呈无序运动,随着温度的降低,固体物质逐渐冷却,内部分子的运动逐渐从无序化向有序化过渡,直到某一低温时固体物质内能降至最小,达到相对稳定的状态。
模拟退火算法依据Metropolis准则以一定的概率接受较差的新解,能够在解空间内不断概率性地跳出局部最优解,具有较强的全局搜索能力[16]。
3.1.2 粒子群算法
粒子群算法(particle swarm optimization,PSO)是一种基于群体智能的优化算法,其基本原理源于对鸟群觅食行为的研究,以信息的社会共享为基础,利用多个带有记忆的粒子作为个体在空间中进行最优解搜索。在搜索过程中,各粒子既保留自身向认知区域最优解靠近的趋势,又通过粒子之间的信息传递获取群体的经验,在搜索空间中追随最优粒子,实现“和而不同”的粒子群搜索。
粒子群算法采用速度-位移的简单模型,通过惯性因子对前次迭代的速度进行继承,并通过学习因子在“自我认知”与“社会经验”间进行平衡,在保留自身认知的同时追随最优粒子,在每一步长搜索后,利用自身的记忆功能对个体最佳位置和群体最佳位置进行更新,逐次迭代更新直至搜索到全局最优解[17]。
根据建立的雷达组网资源调度模型,将粒子群算法引入资源调度问题的求解,通过其与模型目标函数、约束条件的有机结合,并融合模拟退火算法的优化思想,对算法适应度函数、编码方式及执行策略等进行改进,提出面向目标分配排序作业的模拟退火混合离散粒子群算法(improved simulated annealing &binary particle swarm optimization algorithm,ISABPSO),将雷达组网的目标分配排序作业方案视作粒子,每一种方案对应一个三维分配矩阵Xm*n*k。由此将问题转化为离散空间的组合优化问题,运用二进制离散粒子群算法,将模型目标函数直接作为适应度函数,在众多方案中搜索使适应度函数取得最大值的方案,即最优解。
3.2.1 编码离散化
大量粒子在D维目标搜索空间中进行搜索,任一粒子c在空间中的位置可由D维位置矢量Xc表示,粒子单位步长移动的距离,即飞行速度可由D维速度Vc表示,粒子的优劣程度可由适应度F(Xc)表示。每个粒子对应的三维分配矩阵Xm*n*k由m×n×k个元素xijt构成,取值为{0,1},每个元素代表一个维度。可将三维分配矩阵Xm*n*k变换为一行m×n×k列的向量粒子,其中元素xijt按照i、j、t依次递增遍历的顺序排列,如图4所示。
图4 粒子编码结构
Fig.4 Particle coding structure
Xc=(xc1,xc2,…,xcD)
(14)
Vc=(vc1,vc2,…,vcD)
(15)
D=m×n×k
(16)
粒子在各维度的寻优空间限定在0~1,即任一粒子c位置矢量在d维上的分量xcd取值为{0,1}。粒子在各维度的飞行速度可通过Sigmoid函数转换为一个范围[0,1]的概率选择参数s,用于判定粒子在该维度移动后的位置矢量取值为0或1,使算法完成编码离散化,适用于离散二进制空间。
3.2.2 初始化粒子群
按照设定的群体规模M,随机生成M个向量粒子,作为初始粒子群,其中每个粒子有D个元素,各元素在{0,1}中取值。资源调度问题求解的目的是在满足充分利用探测资源的条件下,尽可能实现探测效益的最大化,原则上所有目标在整个作战时间内都会被3部雷达探测到。为了提高算法的求解效率,在构造初始粒子群中的每个粒子时,生成3×m×k个1元素,随机放入一行m×n×k列的向量粒子中,其他各元素取值为0,使各粒子的适应度更接近于问题最优解的最大适应度,以此加快收敛速度。
3.2.3 极值更新
在每次迭代过程中,粒子(c)都以个体极值Pbest,c和全局极值Gbest等2个极值为目标来实现自我更新,并通过对比适应度存储新的极值,经历多次迭代,最终得到适应度最大的最优粒子。其中,个体极值Pbest,c为粒子自身搜索到的历史最优解,用以表示目前个体最佳位置,全局极值Gbest为整个粒子群搜索到的历史最优解,用以表示经所有粒子搜索后的群体最佳位置。
Pbest,c=(pc1,pc2,…,pcD)
(18)
Gbest=(g1,g2,…,gD)
(19)
3.2.4 粒子更新
在粒子更新过程中,运用完全型粒子群算法公式对粒子各维度的速度和位置进行更新。粒子在每一步长的运动中,均以追寻当前2个极值为目标,通过对自身速度和位置在各维度上的更新,实现迭代寻优。
粒子c的d维速度更新公式为:
可见速度更新公式由惯性部分、认知部分、社会部分等3个部分组成。惯性部分通过惯性因子w控制粒子前次迭代速度对当前迭代速度的影响大小;认知部分通过自我学习因子c1调节粒子移动步长受自我影响因素的大小;社会部分通过群体学习因子c2调节粒子移动步长受群体影响因素的大小[18]。其中,学习因子c1和c2均不为0,避免出现“盲目从众”或“盲目自大”的现象。式(22)中r1和r2均表示取值范围[0,1]的随机数,用于增强算法的搜索随机性。粒子在3个部分的共同作用下,综合各影响因素以决定下一步的移动,如图5所示,其中,灰色线条表示前次迭代速度对粒子的影响,蓝色线条表示个体最佳位置对粒子的影响,红色线条表示群体最佳位置对粒子的影响。粒子更新的速度变化范围限定在[-vmax,d,vmax,d]内。
图5 粒子更新示意图
Fig.5 Particle update diagram
在粒子速度得到更新后,通过对概率选择参数s的判断,完成粒子位置的更新。随机产生一个0到1之间的随机数ρ,若ρ小于此刻的Sigmoid函数值,则粒子位置矢量在该维度更新后取值为1,否则取值为0。
粒子c的d维位置更新公式为:
3.2.5 模拟退火机制
针对二进制离散粒子群算法易陷入局部最优的问题,在算法执行过程中增加模拟退火机制,利用模拟退火算法在搜索过程中概率突跳的能力对其进行混合改进,增强其全局搜索能力。
根据初始粒子群中全局极值的适应度计算得出模拟退火机制的初始控制温度T0,并设定降温函数。
Tk+1=λTk
(25)
基于Metropolis准则,通过将个体极值Pbest,c和全局极值Gbest视作模拟退火的新解和旧解,计算各Pbest,c的退火适应度,用于确定接受较差新解的概率[19]。
运用轮盘赌选择法,从所有个体极值Pbest,c中选取一个作为本次迭代的新解,用以替换全局极值Gbest旧解。通过对各Pbest,c的退火适应度依次累加,计算得到累积概率comfit(n),随机产生一个0到1之间的随机数pBet,使累积概率无限逼近它,选用满足条件comfit(r-1)<pBet≤comfit(r)的第r个粒子的个体极值Pbest,r作为新解,分别以其d维上的prd替换速度更新公式中的gd,使粒子的速度更新在模拟退火机制下运行。
在粒子更新后判定是否满足终止条件,若满足则输出最优解,否则通过降温函数降低控制温度后,在新的控制温度Tk下,再次迭代搜索最优解。
算法步骤如下。
步骤1 将三维分配矩阵Xm*n*k中元素xijt按照i、j、t依次递增遍历的顺序排列,进行m×n×k位的二进制编码,并通过Sigmoid函数将粒子速度转换为用于判定的概率选择参数s,使粒子的位置更新适应二进制编码,完成离散化处理。
步骤2 随机生成一个包含M个粒子的粒子群,每个粒子初始位置随机取初始速度随机取其中初始位置的元素中包含3×m×k个1元素,且满足模型约束条件。
步骤3 计算每个粒子的适应度,将每个粒子的初始位置存储在其个体极值中,并将所有粒子中适应度最大的粒子初始位置存储在全局极值中。
步骤4 根据全局极值的适应度计算得到模拟退火过程的初始控制温度T0。
步骤5 基于Metropolis准则,计算当前温度下各粒子个体极值的退火适应度。
步骤6 通过对各粒子个体极值的退火适应度依次累加,计算得到累积概率comfit(n),运用轮盘赌选择法,依累积概率从所有粒子个体极值中选取一个替换速度更新公式中的全局极值。
步骤7 通过粒子的速度和位置更新公式对粒子进行更新。
步骤8 粒子更新后依据约束条件对其进行判定,若不满足约束条件需进行群体修正后转入后续步骤。
步骤9 通过对比各粒子与其个体极值的适应度,更新个体极值,通过对比全局所有粒子个体极值的适应度,更新全局极值。
步骤10 判定是否满足终止条件,若目标函数值收敛或达到最大迭代次数,则对当前全局极值进行解码,输出最优目标分配排序作业方案,否则依降温函数进行退火操作后返回步骤5。
算法的流程图如图6所示。
图6 ISABPSO算法流程
Fig.6 Flow chart of improved simulated annealing &binary particle swarm optimization algorithm
选用计算时间、资源节省率和算法合格率作为评价指标,通过与枚举法对比以验证算法的可靠性与先进性。其中,计算时间是指在设定的计算机配置条件下,算法从开始运行直至结束所消耗的时间;资源节省率是指在满足任务要求情况下空闲单位探测资源数量占总探测资源数量的比例;算法合格率是指蒙特卡洛实验环境下超过设定目标函数合格线(最大值的90%)的实验次数占总实验次数的比例。
构建一个空间目标监视任务仿真实例:4部雷达装备(如表2所示)组成预警监视雷达组网,在15个单位作战时间内对16个价值等级不同的空间目标(如表3所示)进行协同探测。设定有效监视弧段时长tmin为3个单位作战时间;各目标进入和飞出雷达探测范围的时刻tij0、tijs以及各雷达截获目标时的波束指向角eij如表4所示。
表2 雷达装备指标
Table 2 Radar equipment indicators
雷达编号测量精度/m探测容量方向约束角/(°)120345210360320460420445
表3 空间目标价值等级
Table 3 Space target value rank
目标编号价值等级目标编号价值等级1,5,9,1313,7,11,1532,6,10,1424,8,12,164
表4 目标进出雷达探测范围时刻及截获时波束指向角
Table 4 Targetentry-exit radar detection range time and beam direction angle during interception
雷达1雷达2雷达3雷达4目标1(1,4),10°(6,8),10°(0,0),15°(0,9),50°目标2(1,4),50°(1,10),65°(0,0),15°(4,8),40°目标3(0,4),10°(1,10),65°(1,10),65°(0,9),40°目标4(0,4),50°(6,8),50°(1,10),65°(4,8),50°目标5(2,8),20°(10,15),20°(2,7),40°(2,6),30°目标6(3,6),30°(6,15),20°(0,10),40°(4,6),30°目标7(3,5),10°(6,15),65°(0,10),70°(2,6),50°目标8(3,7),20°(10,15),65°(2,7),70°(2,6),50°
续表(表4)
雷达1雷达2雷达3雷达4目标9(6,12),50°(6,12),65°(4,9),50°(6,12),10°目标10(5,8),45°(1,6),10°(6,9),60°(0,0),40°目标11(6,12),50°(6,12),65°(6,9),60°(9,12),10°目标12(8,10),45°(1,11),10°(1,9),50°(0,0),10°目标13(11,15),50°(0,0),30°(5,8),50°(10,15),50°目标14(10,13),20°(9,12),30°(5,8),50°(11,15),20°目标15(12,15),20°(0,0),40°(11,12),45°(11,15),45°目标16(10,13),20°(9,12),40°(2,12),45°(9,15),20°
以仿真实例为背景,在2.8 GHz Intel Core i7处理器和8G内存的计算机配置条件下进行计算,分别用枚举法(ENUM)和ISABPSO算法求解,ISABPSO算法参数取值如表5所示。
表5 ISABPSO算法参数取值
Table 5 Parameter value of ISABPSO
算法参数数值目标函数赋权值K1,K2,K30.3,0.4,0.3粒子群群体规模M100惯性因子w0.5自我学习因子c12群体学习因子c22粒子更新速度变化限定值vmax,d1模拟退火降温参数λ0.8最大迭代次数100
2种方法下目标函数曲线分别如图7和图8所示,ENUM算法中目标函数在循环800次时取得最大值0.726 57;而ISABPSO算法中目标函数仅在迭代70次时取得最大值0.7873。以甘特图形式表示ISABPSO算法下的最优目标分配排序作业方案,如图9所示,并记录2种方法下的评价指标数值,如表6所示。
表6 ISABPSO算法与ENUM算法对比
Table 6 Comparison between ISABPSO and ENUM
方法计算时间/s资源节省率/%算法合格率%ENUM13047.152.3ISABPSO6898.584.6
图7 ENUM算法目标函数曲线
Fig.7 Objective function curve of ENUM
图8 ISABPSO算法目标函数曲线
Fig.8 Objective function curve of ISABPSO
图9 最优目标分配排序作业方案甘特图
Fig.9 Ganttchart of optimal target assignment and sequencing operation scheme
本研究创造性地提出“预警任务+监视任务”的研究思路,将层次分析法和人工智能算法引入预警监视雷达组网资源调度,面向预警与监视任务场景构建资源调度模型,在模拟退火算法和粒子群算法的基础上提出了ISABPSO算法,对预警监视任务中的雷达组网资源调度问题进行求解。根据仿真实验可得出以下结论:
1) ISABPSO算法有效提高了求解方法的运算速度。
2) ISABPSO算法有效提高了资源调度方案的资源利用率。
3) ISABPSO算法有效提高了求解方法的鲁棒性。
综上所述,运用ISABPSO算法,可通过更具优势的智能手段解决预警监视任务中的雷达组网资源调度问题,探索了一条开展预警监视系统资源调度研究的新途径、新思路,能够在一定程度上为预警监视领域研究学者和装备操控技术人员开展后续研究提供帮助。
[1] 周尚辉,曾德贤,刘舆.基于遗传算法的地基空间目标监视网布站优化与仿真[J].航天电子对抗,2021,37(6):38-42.
ZHOU Shanghui,ZENG Dexian,LIU Yu.Location optimization and simulation of ground based space target surveillance network based on genetic algorithm[J].Aerospace Electronic Warfare,2021,37(6):38-42.
[2] 曾德贤,魏振华,周尚辉,等.太空态势感知理论与实践研究[M].北京:国防工业出版社,2022.
ZENG Dexian,WEI Zhenhua,ZHOU Shanghui,et al.Research on theory and practice of space situation awareness[M].Beijing:National Defense Industry Press,2022.
[3] OSOROO B,OUGHTONE J.A techno-economic framework for satellite networks applied to low earth orbit constellations:assessing Starlink,OneWeb and Kuiper[J].IEEE Access,2021,9:141611-141625.
[4] AL-HRAISHAWI H,MINARDI M,CHOUGRANI H,et al.Multi-layer space information networks:access design and softwarization[J].IEEE Access,2021,9:158587-158598.
[5] 鄢青青,沈怀荣,邵琼玲.基于遗传-模拟退火算法的空间目标地基监视调度方法[J].系统工程与电子技术,2015,37(12):2764-2771.
YAN Qingqing,SHEN Huairong,SHAO Qiongling.Space object ground-based surveillance scheduling based on genetic-simulated annealing algorithm[J].Systems Engineering and Electronics,2015,37(12):2764-2771.
[6] 鲁彦希.网络化雷达协同探测与资源管理研究[D].成都:电子科技大学,2020.
LU Yanxi.Research on collaborative sensing and resourcemanagement of networked radar[D].Chengdu:University of Electronic Science and Technology of China,2020.
[7] QU S,ZHENG Y,YAN H,et al.Operational effectiveness evaluation of antimissile early warning based on combination weighted TOPSIS[J].Journal of Physics:Conference Series,2021,1927(1):012007.
[8] 刘翔春.空间目标光学监视卫星轨道设计及任务规划[D].长沙:国防科技大学,2018.
LIU Xiangchun.Orbit design and task planning of optics surveillance satellite for space objects[D].Changsha:National University of Defense Technology,2018.
[9] ZHOU C,YIN J J,RONGA Q,et al.Research on UAV fire fight based on Analytic Hierarchy Process[C]//Proceedings of the 2021 1st International Conference on Control and Intelligent Robotics (ICCIR’21),2021:16-22.
[10] 宋科康,杨宇翔,刘成元.被动多传感器空时联合检测前跟踪方法[J].兵器装备工程学报,2020,41(6):164-168.
SONG Kekang,YANG Yuxiang,LIU Chengyuan.Space-time track-before-detection method with multiple passive sensors[J].Journal of Ordnance Equipment Engineering,2020,41(6):164-168.
[11] CHOI S,CHUN J,PAEK I,et al.Optimal beam steering angles of a sensor array for a multiple source scenario[J].Computer Science &Information Technology (CS& IT),2016,6(1):141-150.
[12] CHEN Z H,LVJ T,YANG W J.Comprehensive evaluation method of missile target threat based on threat grading and PCA-TOPSIS[J].Electronic Measurement Technology,2019,42(20):83-87.
[13] THEODOROU I,ILIOUDIS C,CLEMENTE C,et al.SISAR imaging for space debris based on nanosatellites[J].IET Radar,Sonar &Navigation,2020,14(8):1192-1201.
[14] 丁鹭飞,耿富禄,陈建春.雷达原理[M].北京:电子工业出版社,2020.
DING Lufei,GENG Fulu,CHEN Jianchun.Principles of radar (6th edition)[M].Beijing:Publishing House of Electronics Industry,2020.
[15] 森栄二,遠藤寿.Space surveillance equipment and space monitoring method:Japan,JP5998336B2[P].2016.
[16] ZHANGX M,YANG Z G,SHI H X,et al.The improved simulated annealing algorithm and application in the surface wave dispersion inversion[J].Earthquake Research in China,2019,33(3):391-402.
[17] YU S C,LI X X,TIAN X,et al.Protein structure prediction based on particle swarm optimization and tabusearchstrategy[J].BMC Bioinformatics,2022,23(S10):352.
[18] MISRA M R,RAY K S.Particle swarm optimization based on novelty search[J].Journal of IEEE Transactions on Evolutionary Computation,2022 (2):1-11.
[19] 岳龙飞,杨任农,张一杰,等.Tent混沌和模拟退火改进的飞蛾扑火优化算法[J].哈尔滨工业大学学报,2019(5):146-154.
YUE Longfei,YANG Rennong,ZHANG Yijie,et al.Improved moth firefighting optimization algorithm based on Tent chaos and simulated annealing[J].Journal of Harbin Institute of Technology,2019(5):146-154.