【化学工程与材料科学】
初馏点是表征燃料馏分组成的重要指标,用于衡量喷气燃料的蒸发特性,在生产和使用中都必须进行检验,以确保发动机工作正常。
近红外光谱技术(NIRS)在燃料快速分析中已得到广泛应用,但光谱中存在对分析和建模没有贡献的无关变量以及影响模型建立、导致模型质量下降的干扰信息,因此有必要在校正模型建立过程中筛选波长以提高校正模型的稳健性和预测能力[1-2]。
由于物质浓度及性质与光谱变量之间存在非线性因素,以及光谱测量过程中仪器的噪声、工作状态变化及环境影响,使线性校正方法难以得到理想的校正模型。尽管PLS方法可以在一定程度上校正非线性模型,但当非线性较为显著时,便较难得到理想的校正模型[5]。而BP神经网络可以实现输入与输出之间的任意非线性映射,具有较强的非线性映射逼近和预测能力。
本文通过iPLS法对建模区间进行优选,采用BP-ANN建立喷气燃料初馏点的近红外定量分析模型,并与PLS所建立的定量分析模型预测效果进行了比对。
共采集了各部队化验室的35个喷气燃料样本,依据GB/T 6536—2010测定初馏点,如表1所示。
表1 样本初馏点值 ℃
样品数量最大值最小值平均值35167.9151.2159.0
样本在25±0.5 ℃条件下采集光谱。样本光谱的波长范围为1 100~2 500 nm,使用5 mm光程的石英比色皿测量吸光度。每个样本的光谱需采集3次,要求重复性小于5×10-4,并取平均光谱作为原始光谱。Kennard/Stone(K/S)算法可选出代表性强、分布均匀的样品,是一种应用较为广泛的样本选取方法[3]。本文采用K/S算法从35个样本中选取30个样品作为校正集样本,5个作为验证集样本。
Savitzky-Golay(S-G)卷积平滑法可以有效地消除光谱中的噪声[4]。为消除光谱的基线平移和背景干扰,采用S-G一阶卷积导数处理平滑后的光谱。窗口宽度是两种预处理方法的重要参数,若窗口宽度太小,S-G卷积平滑法的去噪效果不佳,S-G一阶卷积导数则会引入噪声,降低信噪比;若窗口宽度过大,两种预处理方法均会在平滑噪声的同时丢失有用信息,造成光谱信号的失真。
S-G卷积平滑法和S-G一阶卷积导数法对光谱预处理的过程和原理较为相似,因此本文两种预处理方法取相同的窗口宽度。为选择合适的窗口宽度,考察两种方法在5~19点范围内对建模效果的影响,如图1所示。通过比较可知,当窗口宽度为15点时,模型的预测性能最好。预处理前后的光谱见图2。
喷气燃料近红外光谱与初馏点相关系数如图3所示,图中所反映的波长与初馏点的相关性较弱,手动选取建模波长较为困难,不易达到理想的效果。
图1 不同窗口宽度下预处理方法对建模效果的影响曲线
图2 预处理前和预处理后的光谱曲线
iPLS法是一种波长区间选择方法,其原理是将全谱区以固定宽度等分成若干等宽子区间,在每个子区间上分别进行PLS回归,建立局部模型,选择交互验证标准差最小局部模型对应的的子区间作为优选区间[5,6],能够简化模型、减少建模波长变量,具有简便快捷、计算量小等优点。应用iPLS方法优选建模区间流程如图4所示。子区间宽度调整为30~70,比较不同区间宽度下iPLS法对建模效果的影响,结果如图5。通过比较,当子区间宽度为55时,对应的最佳子区间所建立的模型预测效果最好,在该宽度的子区间下,选择1 650~1 705 nm光谱区间作为优选的建模区间。
图3 波长-初馏点相关系数曲线
图4 iPLS区间优选方法流程框图
图5 不同宽度下iPLS优选区间建模效果曲线
为研究区间组合对模型质量的影响,将iPLS法计算得到的交互验证标准差最小的5个区间1 650~1 705 nm、1 320~1 375 nm、1 210~1 265 nm、2 475~2 500 nm、1 705~1 760 nm组合,比较组合区间建立校正模型的预测能力。不同个数的最佳区间组合见表2。通过比较,以1 650~1 705 nm作为建模区间所建立的校正模型预测能力最佳,因此,应以该区间作为最终的优选建模区间。
表2 不同区间组合对模型预测能力的影响
区间组合SEVR2v11.890.801,22.850.551,2,32.910.531,2,3,52.930.521,2,3,4,53.500.32
如图6所示,BP神经网络由输入层、隐藏层和输出层组成。光谱数据由输入层输入向量x后,施以权重传输至隐藏层,隐藏层经过权值、阈值和激励函数运算后传输到输出层,由输出层给出预测值y,若预测值与实测值之间的误差较大,则从输出层开始反向传播该误差,进行权值、阈值的调整,直至误差减小到给定的范围[7]。若输入向量维数过高,输入层神经元过多,会导致网络训练时间太长,造成运算无法收敛。本文将iPLS法优选的波长区间作为神经网络的输入,输入向量维数从1 400减少到55,能够提高神经网络的训练速度,降低校正模型复杂度。
图6 BP-神经网络结构示意图
构建隐藏层数为3,目标均方差为10-6,学习率为0.001,输入层和隐含层的传递函数均采用tansig函数,输出层的传递函数采用purelin函数的BP-ANN,以iPLS法优选的校正集光谱建模区间作为神经网络的输入,建立初馏点校正模型,对验证集样本的初馏点进行预测,结果见表3。通过配对t检验,得t值为0.32,低于显著性水平α=0.05,自由度为5时的临界值2.571,表明模型预测的准确度较高。
表3 验证集样本初馏点预测值 ℃
序号实测值预测值残差1161.6163.51.92166.8166.2-0.63163.1162.8-0.34157.6157.90.35156.3155.70.6
分析表4和图7所示不同建模方法建立的初馏点校正模型预测准确度数据,可知:采用全谱区建立的PLS校正模型预测效果不及iPLS优选区间后所建立的PLS校正模型;在优选区间相同情况下BP-ANN校正模型优于PLS校正模型。
文献[8]在700~1 100 nm的短波近红外光谱区间内,建立的初馏点校正模型的预测相关系数r为0.886 1,验证标准差为2.69 ℃。综合比较,iPLS结合BP-ANN方法在长波近红外光谱区间内能够建立预测能力较强的初馏点近红外校正模型。
表4 不同方法所建模型评价参数值
建模方法SECSEVR2v全谱区PLS2.942.370.69iPLS-PLS1.771.890.80iPLS-BP-ANN1.041.070.94
图7 样本初馏点预测值与真实值关系图
针对喷气燃料初馏点近红外光谱校正模型的建立,研究了不同建模区间和不同建模算法的建模效果。通过对不同区间PLS校正模型以及同一优选区间下不同建模算法进行比较,证明iPLS和BP-ANN均可在一定程度上提高模型的预测准确度。iPLS区间优选结合BP-ANN建模能够有效解决全谱区内干扰信息对校正模型的影响,有利于建立准确度更高的近红外光谱定量分析模型。
[1]FRENICH A G,JOUAN-RIMBAUD D,MASSART D L,et al.Wavelength Selection Method for Multicomponent Spectrophotometric Determinations Using Partial Least Squares.Analyst,1995,120(2):2787-2792.
[2]ZOU X,ZHAO J,POVEY M J W,et al.Variables selection methods in near-infrared spectroscopy.Analytica Chimica Acta,2010,667(1/2):14-32.
[3]褚小立.化学计量学方法与分子光谱分析技术[M].北京:化学工业出版社,2011.
[4]褚小立,袁洪福,陆婉珍,等.近红外分析中光谱预处理及波长选择方法进展与应用[J].化学进展,2004,16(4):528-541.
[5]黄富荣,李仕萍,余健辉,等.基于iPLS的血清胆固醇、甘油三酯近红外定量分析[J].光谱实验室,2011,28(6):2774-2778.
[6]NORGAARD L,SAUDLAND A,WANGER J,et al.Interval Partial Least-Squares Regression (iPLS):A Comparative Chemometric Study with an Example from Near-Infrared Spectroscopy[J].Applied Spectroscopy,2000,54(4):413-419.
[7]闻新.MATLAB神经网络应用设计[M].北京:科学出版社,2000.
[8]邢志娜,王菊香,刘洁,等.航空煤油初馏点近红外光谱分析数学模型的预处理方法及波段优选[J].理化检验-化学分册,2013,49:49-32.
Citation format:LIU Yangjun, WANG Juxiang, XING Zhina.Study on Near Infrared Analysis Model of Initial Distillation Point of Jet Fuel Based on iPLS and BP-ANN[J].Journal of Ordnance Equipment Engineering,2020,41(06):212-215.