-
0 引言
-
汽车的普及使用增加了人们交通出行的便捷性,但也随之加重了环境受污染的程度.现如今日益严峻的健康和环境问题促使各国都在重新考虑汽油中各种化合物的质量标准,清洁措施的重中之重就是降低汽油中的硫、烯烃含量.在催化裂化为核心的重油轻质化工艺进行脱硫和降烯烃过程中,普遍会降低汽油辛烷值.辛烷值(RON)是反映交通工具所使用燃料(汽油)燃烧性能的最重要指标.一般来说,提高汽油中辛烷值的占比,将会有效提高其抵抗震爆的性能,而抗爆性能的高低是体现汽油燃烧性能的主要指标.而炼油生产过程中辛烷值的损失将导致油品经济效益的骤然下跌,每增加1个单位的精制汽油辛烷值损失,每吨汽油销售价格将降低150元.例如在一个每年生产100万t精制汽油的S Zorb装置中,如果能够使辛烷值损失降低0.3个单位,销售经济效益将提升4 500万元.因此,降低催化裂化汽油精制脱硫装置中辛烷值的损失具有重要的理论价值和现实意义.
-
在现有的研究文献中,针对汽油精制过程中辛烷值的研究可总结为三种:一是讨论使用汽油物理特性测试数据通过线性建模分析来快速测定汽油辛烷值.丁怡曼等[1]利用红外光谱法结合偏最小二乘法构建PLS模型来对113个样品进行汽油辛烷值的预测;Kardamakis等[2]利用近红外光谱法收集了249个汽油数据样本,构建辛烷值和苯含量分析的定量预测模型,同时对比分析了C_PLS法和D_PLS法的模型求解效果.二是针对汽油各种组成成分或者原子团对辛烷值贡献进行定性和定量分析,并构建其关系之间的拟合模型.黄水望等[3]利用气相色谱法和偏最小二乘法构建汽油详细组分和辛烷值之间关系的数学模型,模型测定结果与实际偏差范围在0~1.1个单位之间,预测性能和精度较好.Ghosh等[4]利用气相色谱技术测定不同型号汽油的辛烷值,构建烃类贡献度大小不同的多元线性回归模型,明确烃类组成对汽油生产调和辛烷值的影响.但不管是根据汽油物理特性数据还是各组成成分或原子团进行预测分析,都不可避免地要使用到相关实验测试设备,而且仪器的运转和维护需要耗费较高的费用,实验测试效率较低.三是利用主成分分析、相关分析、偏最小二乘法、逐步线性回归等方法研究汽油的其他理化质量指标和抗爆性能指标辛烷值之间的关系,得出相关关系式来测定不同汽油的辛烷值.熊春华等[5]以乙醇汽油和车用汽油为研究对象,分析其抗爆性能指标与其他理化指标的关联,采用逐步线性回归和相关分析来建立方程关系式,研究表明各理化指标产生的影响均不相同,需遵循相关规律来配合实际生产.
-
截至目前,利用各种理论测量方法来进行化工过程建模预测汽油辛烷值的相关研究工作取得了一定的进展,但这些传统研究方式一般都是简单的数据关联或机理建模,所构建模型中涉及的操作变量数量相对较少,相关变量分析存在明显缺陷,使得辛烷值的预测分析结果与实际相比存在较大的误差.而现阶段催化裂化精制汽油所需的生产设备多种多样,加工技术及工艺过程非常复杂,各操作变量之间具有严重非线性和影响因素相互强耦联的特点,若继续采用以往的研究方式将出现过程优化响应时效性较差、变量优化成效一般的情况.
-
因此,本文考虑到现有化工过程监测和控制硬件设备技术的发展,将利用采集到的中国石化公司多年来催化裂化生产精制汽油保留下来的大量历史数据,结合数据挖掘技术发现隐藏在深层的重要信息.同时,因为神经网络技术强大的函数映射能力和高度非线性描述能力等优点,它已经被广泛应用于化工过程非线性系统建模领域.本文在利用Lasso算法初步筛选变量后,选择利用BP神经网络计算指标因子贡献度,得出主要变量用于构建汽油辛烷值损失预测模型.经过模型效果分析对比决定使用BP神经网络模型来预测辛烷值,并把BP神经网络和多元线性回归模型相结合来对主要变量进行优化调控,对优化调整过程中辛烷值和硫含量变化进行可视化展示,以提升汽油品质为企业的炼油生产过程提供可靠的理论操作借鉴.
-
1 数据收集和清洗
-
1.1 数据来源
-
本文采集到的实验数据来自于中国石化上海高桥石油化工有限公司催化裂化汽油精制脱硫装置运行多年保留下来的历史数据 [5-7].关于汽油精制生产工作,该公司建立了2个规模可观的数据库,即PHD和LIMS实验数据库.有关实验建模的原料、产品和催化剂等性质数据均可以每周2次的频率从这2个实时数据库中采集得到.为了确保实验和分析等方面的有效性与准确率,本文将数据采集时间跨度范围扩充到3年,即从LIMS数据库中获取2017-04—2019-09和2019-10—2020-05这2个时间段的生产信息.而操作变量数据可从PHD数据库中获取,2次数据采集时间的频次不同,分别是每3 min 1次和每6 min 1次.采集到的原始实验数据样本一共有325个,每个数据样本中都有367个特征变量,包括7个原料性质、2个待生吸附剂性质、2个再生吸附剂性质、2个产品性质等不可操作变量以及另外354个操作变量.为了使数据处理和分析更加系统化,可以按时间戳将其进行降序排列,并结合数据挖掘技术应用到化工过程建模中,得到隐藏在这些数据之后的更多更重要的信息.
-
1.2 数据清洗
-
1)删除全部为空值的位点.遍历全部数据样本,筛选出共有19个操作变量数据全部为空值,故删除上述位点.
-
2)对样本数据节点进行过滤,删除2个由于残缺数据过半而无法补充完整的变量位点.
-
3)对于样本中其余值为零的数据,使用控制前后2 h的数据平均值替代.
-
4)根据汽油精制工艺要求及操作经验可以得出操作变量的最大最小取值范围,对于7个超出此范围的变量数据进行剔除.
-
5)运用拉依达准则(3σ准则)判断数据是否存在粗大误差,剔除此类误差数据.利用MATLAB计算误差并比较发现样本原始数据中不存在异常值,无需剔除.
-
6)由于研究需以辛烷值作为目标数据,而辛烷值的测量比较麻烦,一周仅2次,样本较少,无法与操作数据样本相匹配,且测量结果存在滞后,故最终样本数据取为辛烷值测量时间前2 h的数据平均值.计算完成数据预处理后,替换原始收集到的样本数据.
-
2 二步法筛选建模的主要变量
-
2.1 基于Lasso的变量初步筛选模型
-
为了更有效地对工程技术应用效果进行分析,需要根据实际催化裂化汽油精制过程所得到的325个样本数据,先对367个变量进行降维,剔除一些次要的对辛烷值损失影响不大的标量,筛选出一定数量的主要变量,以便后续能精准有效地建立辛烷值的损失预测模型.Lasso线性模型在变量选择方面的精度比逐步回归法和岭回归法等能更精确、更全面地筛选出主要影响变量,其最大优点在于可以直接将不重要变量的系数直接压缩为0,而不保留所有变量[6-10].因此,采用Lasso对367个影响变量进行初步筛选,通过比较解释变量与被解释变量之间相关性的大小,删除不重要变量并保留主要变量,降低影响变量之间的多重共线性,使其相互独立,从而提高解的空间稳定性并进一步使得模型的泛化能力增强.
-
2.1.1 Lasso线性回归模型的建立
-
运用Lasso方法初步筛选变量的步骤如下:
-
1) 特征标准化.观察367个变量发现其量纲并不一致,为了避免量纲对研究结果的影响,需要利用极差标准化法对数据进行标准化处理.
-
2) 建立Lasso线性回归模型.由于研究样本中有367个自变量和1个因变量,可根据线性回归模型建立以下关系式:
-
式中,α0为常数项,α1,α2,···,α367为回归系数,ε为随机扰动项.
-
该模型中未知参数α的Lasso估计的定义为
-
其中,t≥0为调和参数.
-
3) 选择最佳的调整参数.对于控制回归系数压缩量的问题,在估计时可以通过调和参数t来实现,经过若干步骤之后可得不同t值下的所有Lasso估计值.在研究中,可选择10折交叉验证法对参数进行调整从而选择出最佳的调整参数.
-
4) 筛选出重要变量.对367个变量进行Lasso回归之后,得出一定数量回归系数不为0的变量,即为第1步所要筛选出的重要变量,其余回归系数为0的变量就会在Lasso线性回归模型中删除掉,被删除掉的可能是导致变量之间存在多重共线性的不重要变量.
-
2.1.2 Lasso模型初步筛选变量的结果分析
-
运用Stata软件对辛烷值损失的367个影响因素进行初步筛选,通过lassopack命令实现Lasso回归,并使用10折交叉验证方法对模型的参数进行调整以达到最佳的状态.根据运行结果可以发现当Lamda = 1.373 349 8时,模型的均方预测误差(MSPE)值达到最小,如图1所示.
-
图1 MSPE最小状态时的参数情况
-
Fig.1 Parameter values at minimum MSPE
-
根据Lasso所估计出的变量系数是否非零来筛选变量,其中系数非零的影响变量被保留下来作为主要变量,且它们之间的多重共线性已经得到一定的削减.经降维筛选过后的主要变量如表1所示,按照从左到右对辛烷值损失影响程度大小进行排列.
-
2.2 基于BP神经网络-指标因子贡献度排名的变量筛选优化
-
2.2.1 BP神经网络-指标因子贡献度模型的建立
-
采用Lasso线性回归模型对367个变量进行初步筛选后得出n个主要影响因素,而这些因素对辛烷值损失影响程度的大小可以通过权重大小来决定.因此,需要进一步优化辛烷值损失的有效变量操作方案.鉴于BP神经网络模型可以通过数据逼近任意线性连续的函数,这一特点与原料性质、待生吸附剂性质、再生吸附剂性质、产品性质、操作变量对辛烷值损失影响方式的特点相吻合.所以选择BP神经网络模型进行n个主要变量的计算,并将其指标数值作为神经网络的输入层,将损失的辛烷值作为输出层.此外,输入层主要变量对输出层辛烷值损失的影响,是由输入层对隐含层的影响和隐含层对输出层的影响这2个部分组成的,如图2所示.因此,输入层n个主要影响变量指标对输出层辛烷值损失的影响权重需综合上述2个部分来进一步计算得出,过程如下:
-
1) 假设各输入变量对各隐含层变量都有一定程度的影响,这些影响的程度可通过输入层作用到隐含层的权重反映.权重计算公式为
-
式中:a0表示每个输入层主要变量对隐含层的影响权重之和;aij表示输入层n个主要变量指标对隐含层中各个变量的权重,其中i和j分别表示输入层和隐含层的节点;表示单个输入层节点对隐含层中所有变量的影响大小之和,i取整数.
-
2) 计算隐含层对输出层辛烷值损失的影响程度.由于输出层仅有辛烷值损失一个指标,所以隐含层对输出层的影响权重等价于隐含层中各个变量与输出层节点的权重之比,其计算公式为
-
式中:bkl为隐含层对输出层影响权重的比例,k和l分别表示隐含层和输出层的节点;为隐含层中单个变量对输出层的权重;表示隐含层全部变量对输出层权重之和,k取整数.
-
3) 计算输入层中n个具体主要影响变量指标对输出层的影响权重,计算公式为
-
式中,Si为输入层中单个的具体主要影响变量对输出层的影响权重.
-
4) 计算输入层中每个指标对输出层影响大小之比例,计算公式为
-
式中,P0表示所有输入层各个指标权重之和,Pi为输入层各个具体主要影响变量指标对输出层辛烷值损失影响的占比.
-
经过对BP神经网络模型的不断调整,最终设置n个输入层、1个隐含层,将隐含层节点数设为10、输出层为1,此设置方式可以使得误差达到最低,如图2所示.
-
图2 BP神经网络-指标因子贡献度计算模型结构
-
Fig.2 Index factor contribution degree calculation based on BP neural network
-
2.2.2 BP神经网络-指标因子贡献度排名结果分析
-
基于BP神经网络的指标因子贡献度计算模型,得出基于Lasso方法初步筛选的61个有用变量对辛烷值损失的影响贡献度.根据贡献度的大小确定最终留下的主要变量,并用于分析辛烷值损失.而选择的个数可以参考确定独立筛选法SIS中的方法[11],选取n/log n个,其中n为61.结合实际情况计算选取15个最主要影响变量,它们对辛烷值损失贡献度排序如图3所示,图3中序号对应的影响变量名称参见表1.图3中CD表示影响变量对辛烷值损失贡献度大小.其中,原料辛烷值(a2)和产品辛烷值(a9)2个变量对辛烷值损失的影响贡献度最大,遥遥领先于其他变量,而辛烷值损失值就是由这2个值计算得出的[12].由此可见,基于BP神经网络的指标因子贡献度计算模型来反映变量对辛烷值损失的影响贡献程度,符合工程的实际应用,具有一定的科学性.
-
3 基于BP神经网络的辛烷值损失预测模型
-
3.1 构建辛烷值损失预测模型
-
利用筛选得出的15个主要变量进行建模预测辛烷值损失,考虑使用多元线性回归、灰色预测、随机森林回归、BP神经网络4种常见建模方法,计算不同方法的均方误差(MSE)与决定系数(R2),对比不同方法的模型精度,进而选择误差最小的模型作为辛烷值损失预测模型.
-
1) 多元线性回归的拟合过程通常利用最小二乘法来逼近,一般假设变量间存在线性关系,如式(10)所示.回归分析时,需要计算回归系数bk,使得计算的因变量与原始数据间的误差最小.
-
图3 15个最主要影响变量对辛烷值损失贡献度排序
-
Fig.3 The15 most important influencing variables ranked by contribution to octane number loss
-
2) GM(1,N)模型与GM(1,1)模型类似,区别在于输入变量个数为N个.基于筛选得到的15个主要影响变量,则N为15,输出变量1个,因此适用于GM(1,N)预测模型.首先对特征数据序列和相关因素序列进行计算,生成一次累加序列再对该序列中两两邻近数取平均生成值序列,然后根据上述序列建立灰色微分方程:
-
3) 随机森林回归是一个用CART算法构建的没有剪枝的分类决策树的集合,输出采用单棵树输出结果的均值.根据每棵决策树的权重ωi(x,θt)(t=1,2,···,k)取每棵决策树观测值的均值作为最终的结果.
-
4) BP神经网络具有较好的非线性映射能力,RON损失预测中影响因素众多,尽管通过Lasso回归及贡献度排序筛选了一部分变量,但剩余15个主要变量间的关系依旧不明确,对RON损失的影响也不清晰,利用该方法的非线性映射可以较好地拟合绝大多数变量与辛烷值损失的关系.此外,神经网络的鲁棒性较佳、容错能力强,变量数据的部分缺失或者异常并不会导致模型产生误差[13].
-
利用BP神经网络映射15个主要变量与辛烷值损失的关系,通过对325个样本训练的拟合预测判断模型精度,进而决定该算法是否可以用于辛烷值损失预测.利用Matlab自带工具箱nftool对数据进行处理,把降维得出的15个主要变量作为输入层变量,输出层即为辛烷值损失.设置隐含层个数为10,训练算法选用最小二乘优化算法(Levenberg-Marquardt).BP神经网络结构如图4所示.
-
图4 BP神经网络预测辛烷值损失的结构
-
Fig.4 Prediction of octane number loss by BP neural network
-
3.2 模型求解与比较分析
-
利用多元线性回归、灰色预测、随机森林回归、BP神经网络4种方法建立辛烷值预测模型,使用Matlab软件进行求解从而找出预测精度最优的模型.通过多次测试设置、调试好各个模型参数后,对样本进行模型训练,计算均方误差(MSE)以及决定系数(R2):
-
通过上述模型预测的RON损失检验结果如表2所示,BP神经网络预测模型的MSE最小,决定系数R2最接近于1,模型精度要优于其他3个模型,故采用BP神经网络模型预测辛烷值损失.
-
3.3 BP神经网络辛烷值预测模型验证分析
-
通过对比4种预测模型后,选用BP神经网络模型作为辛烷值损失预测模型,并将对此使用10折交叉验证的方法来判断结果的可靠性.即随机抽取10份样本,把其中1份样本作为测试集,其余9份作为训练集,如此循环10次,使得每份样本都能作为一次测试集.对随机建立的10个训练集来计算10个模型,对测试集分别得到10个均方误差(MSE)、决定系数(R2),再求出10个模型的MSE均值以及R2均值.
-
从表3的10折交叉验证结果可知,MSE均值为0.027 193(接近0),R2均值为0.904 87(接近1),故认为BP神经网络的预测精度较高,符合预期.但上述10份样本的模型训练精度低于用全部325个样本进行训练所得模型,因样本数较少,模型训练时不可控因素较多,故10个训练模型仅用于验证BP神经网络预测方法的适用性,而不用于最终的辛烷值损失预测模型.
-
本文的辛烷值损失预测模型将原始样本中的70%数据序列(227个样本)用于模型训练,15%的数据序列(49个样本)用于模型验证,剩余15%的数据序列(49个样本)作为模型测试集.基于BP神经网络的辛烷值损失预测模型误差结果如图5所示.
-
图5 MSE结果
-
Fig.5 MSE results
-
根据BP神经网络建模过程可知,该模型在第8次迭代时达到最优精度,此时验证集的MSE为0.001 182,训练集和测试集的误差都较小.图6是对每个样本实际值与模型预测输出值误差建立的直方图,图中误差集中在0附近,有76.3%的样本误差位于-0.01和0.01之间.除142号样本外,其余样本误差绝对值均小于0.1,所有样本误差平均值为-0.001 009 44.模型训练结果如表4所示,训练集、验证集、测试集的MSE都足够小,接近于0,且R2都大于0.99,接近于1,故认为该预测模型可用于汽油辛烷值损失预测工程中.
-
图6 误差直方图
-
Fig.6 Error histogram
-
图7是各数据集的输出值与辛烷值损失实际数据的比较,可以发现模型输出值能较好地拟合原始数据,同样可验证利用BP神经网络模型在15个主要输出变量基础上预测辛烷值损失的精度较高.
-
图7 预测结果拟合
-
Fig.7 Fitting of prediction results
-
4 主要变量操作方案的优化
-
根据已建立的辛烷值损失预测模型,并分析了S Zorb装置产品的历史脱硫数据,计算得知所有油品的硫质量分数平均值是4.75 μg/g.为保证汽油产品脱硫效果,欧VI和国VI标准中汽油产品硫质量分数不得大于10 μg/g,但为了给企业装置操作留有空间[14],要求在实际生产中产品硫质量分数不大于5 μg/g.在此前提下,利用已知数据样本对主要变量进行优化,从而使辛烷值损失降幅达到理想状态.
-
首先探索单一变量的改变对基于BP神经网络建立的辛烷值预测模型的影响.使用控制变量法使其他变量保持不变,只改变单一变量取值,进而预测辛烷值的损失.在此基础上,为使辛烷值损失降幅达到30%,利用上文所构建的多元线性回归模型对需要调控的操作变量进行处理.在优化处理过程中原料性质、待生吸附剂性质、再生吸附剂性质保持不变,因此主要调节15个主要影响变量中的11个操作变量,通过添加调节系数进行变量调控.最后提出具体的优化操作条件,使辛烷值损失降到最低.
-
4.1 基于BP神经网络的主要变量优化调控模型
-
使用控制变量法探究单一变量对BP神经网络建立辛烷值预测模型的影响.首先筛选出硫质量分数不大于5 μg/g的样本共268个,再随机抽取10个样本进行优化.预测模型的主要变量共15个,其中操作变量11个,其取值范围以及调整幅度值如表5所示,使用Matlab建立循环语句,保持其他变量不变,将单一变量由取值范围的最低值以调整幅度值为间隔变化至取值范围的最大值.利用前文建立的BP神经网络模型预测辛烷值损失,具体过程如图8所示.
-
图9是对10份样本分别控制9个操作变量的取值:再生器顶底差压、F-101辐射室出口压力、稳定塔底出口温度、D-201含硫污水排量、加氢裂化轻石脑油进装置流量、干气出装置流量、S_ZORB AT-0010、D-109吸附剂料位、R-102床层吸附剂料位密度等.基于前文模型预测出的辛烷值损失变化曲线,由于D-109压力、非净化风进装置压力2个变量取值范围较小,调整幅度值相对较大,导致循环次数过少,因此未在图中表示.分析图9发现,单一控制稳定塔底出口温度升高,辛烷值(RON)损失预测值明显下降,且温度低于120℃左右时,下降幅度较大,此后温度继续升高对RON损失的影响较小.除了该变量外,单一控制其他变量并不能对RON损失预测值产生明显影响,或影响不稳定,如改变D-201含硫污水排量时,4个样本的损失值无明显变化,3个样本损失值明显上升,一个样本损失值小幅度波动,还有2个样本损失值呈下降趋势.
-
基于以上分析,研究认为仅仅改变单一变量取值并不能影响RON损失值,更不能达到辛烷值损失降幅大于30%的生产要求,所以需要考虑同时改变多个变量,优化操作条件,从而达到尽量降低辛烷值损失的目的.由于神经网络算法属于“黑箱方法”,在研究时只能得出输入输出变量,无法了解内部结构,若利用该算法同时对多个变量进行优化较为复杂.而多元线性回归模型的预测精度仅次于BP神经网络,且算法简单、易操作,更适合同时对多个变量进行优化,故将利用该模型预测辛烷值损失并优化主要操作变量.
-
图8 控制变量法流程
-
Fig.8 Flow chart of control variate approach
-
图9 控制单一变量的预测结果
-
Fig.9 Predictive results of single variable controlling
-
4.2 基于多元线性回归的主要变量优化调控模型
-
多元线性回归模型体现的是多个解释变量和被解释变量之间的关系问题,利用筛选得出的15个最主要影响变量和1个因变量,建立以下关系式:
-
式中:α0为常数项;α2,α9,···,α11为回归系数.
-
此外选择拟合优度检验法对该模型进行计算验证.拟合优度的含义是样本具体观察数值在回归线附近聚集的紧密程度.一般选用R2判断多元线性回归拟合优度.而拟合优度是在分解总离差平方的基础上测算出来的.其中总离差平方和计算公式为
-
其中,SSE为残差平方和,SSR为回归平方和,SST为总离差平方.计算公式如下:
-
其中,是样本观察值均值,是估计值.决定系数R2便是通过回归平方和占总离差平方和的比例,计算公式为
-
决定系数R2反映线性回归方程的拟合程度,表示解释变量和被解释变量之间存在的回归关系可以用来解释所有偏差中的百分比.R2取值范围为[0,1],趋近于1,拟合效果越好,越趋近于0效果越差[15].
-
为使辛烷值损失降幅达到30%,对需要调控的操作变量进行处理.在优化处理过程中原料性质、待生吸附剂性质、再生吸附剂性质保持不变,即在11个操作变量前添加调节系数来进行调控,基于多元线性回归模型的变量调控模型表达式为
-
式中:η为辛烷值损失降幅;β53,α94,···,α359为调控系数.
-
在最小二乘法准则的指导下,对各个调控系数进行参数估计.将产品硫质量分数不大于5 μg/g的样本数据代入式(20),得到方程组:
-
根据最小二乘法可以得到参数估计为
-
通过求取调整参数可以得出各个主要操作变量的优化操作条件.
-
因此,用于表示15个主要解释变量和被解释变量辛烷值损失之间关系的线性回归模型最终方程式如下:
-
通过多次测试设置并调试好各个模型参数后,对样本进行模型训练,然后利用所得模型预测辛烷值损失,运用上文所述相关误差检验公式,计算得出MSE为0.000 26,R2为0.995 1,模型精度较好,故可采用多元线性回归模型预测辛烷值损失和优化操作变量.
-
基于多元线性回归模型的将辛烷值损失降幅调到30%的变量调控模型表达式为
-
根据最小二乘法估算出来的调节系数数值大小和正负性来对变量进行调控.对再生器顶底差压和R-102床层吸附剂料位密度按照一定的比例进行反向调控,对D-109压力、F-101辐射室出口压力、稳定塔底出口温度、D-201含硫污水排量、非净化风进装置压力、S_ZORB AT-0010和D-109吸附剂料位按照一定的比例进行正向调控,那么辛烷值损失降幅就会达到甚至超过30%.
-
5 优化调整过程的可视化展示
-
工业生产在对汽油进行精制过程中,需要对催化裂化汽油进行脱硫和降烯烃,进而提高汽油的燃烧性能.然而由于生产条件、机器设备各方面的限制,无法将各操作变量一次性提高至最优值,故需要逐步平稳调整.由于所收集到的133号样本与其他企业的大部分S Zorb装置生产数据相似,所以主要针对133号样本数据进行分析[16].为充分了解并分析操作变量优化过程中汽油辛烷值与硫含量的变化趋势,首先需要建立硫含量预测模型,由上文中预测模型误差对比发现,BP神经网络算法精度最高,故可利用该方法构建硫含量预测模型.操作条件的优化通过操作变量在取值范围内按照一定幅度的逐渐变化实现,并在主要操作变量基础上预测辛烷值损失及硫含量,绘制出调整过程中产品性质的变化轨迹[17].
-
5.1 构建硫含量预测模型
-
与基于BP神经网络辛烷值损失预测模型相类似,采用Matlab软件工具箱nftool处理变量数据,输入层为15个主要影响变量,输出层为硫含量,隐含层节点数为10,变量数据为原有数据中硫质量分数小于等于5 μg/g的样本,一共268个.其中70%样本数据作为训练集,15%样本数据作为验证集,剩余15%样本数据为测试集,从而建立基于BP神经网络的硫含量预测模型(图10).模型的MSE为0.059 3,与辛烷值损失预测模型相比误差较大,但仍在允许误差范围内,因此该模型可用于硫含量预测[18].
-
图10 硫含量预测模型误差直方图
-
Fig.10 Error of sulfur mass fraction prediction model
-
5.2 主要变量优化的可视化分析
-
关于操作变量的优化条件,已在本文第4章中详细阐述,可以得出再生器顶底差压(用变量1代替)、F-101辐射室出口压力(用变量2代替)、非净化风进装置压力的大幅度变化,D-109压力(用变量3代替)、稳定塔底出口温度(用变量4代替)、S_ZORB AT-0010(用变量5代替)的小幅度优化会对降低产品的辛烷值损失产生影响[19].
-
图11为改变变量1和变量2所预测得出的产品硫质量分数变化轨迹.由图11可以发现,样本的硫质量分数预测结果波动较大.在变量1位于[30,35],变量2位于[-0.3,-0.2]范围内时,硫质量分数取极小值;变量1接近于上限,变量2接近于下限时,硫质量分数取极大值;同时变量1极小,变量2极大时,硫质量分数也是小范围的极大值.
-
图12为改变变量1和变量2所预测得出的产品辛烷值损失变化轨迹.三维曲面图较为平滑,符合上文的分析结果,同时可以发现变量1为极小值,变量2为极大值时,辛烷值的损失预测结果最小.
-
图13表示其他变量不变时,133号样本的D-109压力(变量3)分别为取值范围的上、下限时,改变变量4和变量5取值预测出的硫含量变化轨迹.当变量3取下限时,产品硫含量较低,但两者变化趋势大体相同,都在变量4取值最大时达到极小值.
-
图11 133号样本硫质量分数变化轨迹
-
Fig.11 Trajectory of sulfur mass fraction in No.133 sample
-
图12 133号样本辛烷值变化轨迹
-
Fig.12 Trajectory of octane number in No.133 sample
-
与图13相类似,图14是不同D-109取值下辛烷值损失预测值的变化轨迹,可知变量3的不同取值不会影响辛烷值损失的变化范围,但改变了辛烷值损失的变化轨迹.变量3取下限时,辛烷值损失在变量4较低时达到极小;而变量3取上限时,恰恰相反辛烷值损失在变量4较低时达到极大[20].
-
6 结论
-
通过对S Zorb装置运行积累的数据进行建模分析,得出以下几个结论:
-
1) 对于催化裂化汽油精制脱硫装置运行积累的大量数据,挑选建模变量时利用了二步筛选法.首先基于Lasso线性模型对多个影响变量进行初步筛选,基于此使用BP神经网络的指标因子贡献度计算模型确定参与化工建模的主要变量.综合利用了2个筛选模型的优势,第1步去除变量的多重共线性,第2步进一步保证留下的影响变量对辛烷值损失有足够的贡献度,两者结合使得筛选得出的变量不仅更精简而且与因变量关系更加紧密.
-
图13 不同D-109取值下的产品硫质量分数变化轨迹
-
Fig.13 Trajectories of sulfur mass fraction under different D-109 values
-
图14 不同D-109取值下的辛烷值损失变化轨迹
-
Fig.14 Trajectories of octane number loss under different D-109 values
-
2) 在构建辛烷值预测模型时把神经网络和多元线性回归模型相结合,首先将基于最小二乘优化算法(Levenberg-Marquardt)的BP神经网络模型用于辛烷值损失预测,其精度和可操作性较高,能够更加准确地预测辛烷值损失.而在优化调控阶段,将神经网络模型和多元线性回归模型同时用于影响变量的调控,两者优势互补并探索出一个有效的变量优化模式.
-
3) 为充分了解并分析操作变量优化过程中汽油辛烷值与硫含量的变化趋势,分析误差对比得知神经网络算法精度最高,即建立基于神经网络的硫含量预测模型.操作条件的优化通过操作变量在取值范围内按照一定幅度的逐渐变化实现,并在主要操作变量基础上预测辛烷值损失及硫含量,可视化展示了优化调整过程中产品性质的变化轨迹.
-
4) 研究所构建的降低汽油精制过程中的辛烷值损失模型能明显降低石油企业炼油生产过程辛烷值的损失,并保证产品的脱硫效果,有效地解决了普通化工建模操作变量少、严重非线性及相互强耦联的问题,可以为石油企业的S Zorb装置生产实际操作提供合理的指导.而后续研究中可根据实际生产的实时性,在预测汽油辛烷值时利用自适应在线极限学习机模型,从而更有效地保证油品质量,提高生产效率,增加经济效益[21].
-
参考文献
-
[1] 丁怡曼,薛晓康,范宾,等.基于PLS-红外光谱的汽油辛烷值测定方法研究[J].化学研究与应用,2021,33(5):863-867 DING Yiman,XUE Xiaokang,FAN Bin,et al.Determination of gasoline octane number based on PLS-infrared spectroscopy[J].Chemical Research and Application,2021,33(5):863-867
-
[2] Kardamakis A A,Pasadakis N.Autoregressive modeling of near-IR spectra and MLR to predict RON values of gasolines[J].Fuel,2010,89(1):158-161
-
[3] 黄水望,赵晓锋,郭振,等.气相色谱法计算汽油的研究法辛烷值[J].广州化工,2018,46(1):145-146,186 HUANG Shuiwang,ZHAO Xiaofeng,GUO Zhen,et al.Determination of research octane number of gasoline by gas chromatography[J].Guangzhou Chemical Industry,2018,46(1):145-146,186
-
[4] Ghosh P,Hickey K J,Jaffe S B.Development of a detailed gasoline composition-based octane model[J].Industrial & Engineering Chemistry Research,2006,45(1):337-345
-
[5] 熊春华,田高友.汽油抗爆性能指标与其他理化指标关联研究[C]//中国汽车工程学会燃料与润滑油分会第十四届年会论文集.沈阳:辽海出版社,2010:126-132 XIONG Chunhua,TIAN Gaoyou.The correlations study of antiknocking properties with other physical-chemical properties of gasoline[C]//Proceedings of the 14th Annual Meeting of Fuel and Lubricant Branch of Chinese Society of Automotive Engineering.Shenyang:Liaohai Publishing House,2010:126-132
-
[6] 杨帆,周敏,金继民,等.智能优化算法及人工神经网络在催化裂化模型分析中的应用进展[J].石油学报(石油加工),2020,36(4):878-888 YANG Fan,ZHOU Min,JIN Jimin,et al.Research progress on application of intelligent optimization algorithm and artificial neural network in FCC model analysis[J].Acta Petrolei Sinica(Petroleum Processing Section),2020,36(4):878-888
-
[7] 欧阳福生,游俊峰,方伟刚.BP神经网络结合遗传算法优化MIP工艺的产品分布[J].石油炼制与化工,2018,49(8):98-104 OUYANG Fusheng,YOU Junfeng,FANG Weigang.Optimizing product distribution of MIP process by BP neural network combined with genetic algorithm[J].Petroleum Processing and Petrochemicals,2018,49(8):98-104
-
[8] 杨帆,周敏,戴超男,等.基于人工智能算法的催化裂化装置汽油收率预测模型的构建与分析[J].石油学报(石油加工),2019,35(4):807-817 YANG Fan,ZHOU Min,DAI Chaonan,et al.Construction and analysis of gasoline yield prediction model for FCC unit based on artificial intelligence algorithm[J].Acta Petrolei Sinica(Petroleum Processing Section),2019,35(4):807-817
-
[9] 张玉瑞,陈微微,周晓龙,等.一种改进的调合辛烷值模型预测汽油研究法辛烷值[J].石油炼制与化工,2016,47(6):42-46 ZHANG Yurui,CHEN Weiwei,ZHOU Xiaolong,et al.RON prediction by improved model for blended gasoline[J].Petroleum Processing and Petrochemicals,2016,47(6):42-46
-
[10] 王天宇,刘忠保,黄明富,等.采用人工神经网络方法建立加氢裂化反应体系模型[J].石油炼制与化工,2015,46(8):90-95 WANG Tianyu,LIU Zhongbao,HUANG Mingfu,et al.Modeling VGO hydrocracking process by BP-ANN technology[J].Petroleum Processing and Petrochemicals,2015,46(8):90-95
-
[11] 朱燚丹,陈兴荣,李秋萍.基于信息增益率的超高维变量选择[J].统计与决策,2021,37(22):18-21 ZHU Yidan,CHEN Xingrong,LI Qiuping.Ultra-high dimensional variable selection based on information gain rate[J].Statistics and Decision,2021,37(22):18-21
-
[12] 杨轶男,任晔,毛安国,等.影响催化裂化装置汽油辛烷值变化的技术因素分析[J].炼油技术与工程,2019,49(6):32-35 YANG Yinan,REN Ye,MAO Anguo,et al.Analysis of technical factors affecting gasoline octane number in catalytic cracking unit[J].Petroleum Refinery Engineering,2019,49(6):32-35
-
[13] 刘禹含,曹萃文.基于LightGBM的催化重整装置产品预测及操作优化相关性分析[J].石油学报(石油加工),2020,36(4):756-766 LIU Yuhan,CAO Cuiwen.Product prediction technology and optimal operation correlation analysis for catalytic reforming unit based on LightGBM[J].Acta Petrolei Sinica(Petroleum Processing Section),2020,36(4):756-766
-
[14] 胡碧霞,张红光,卢建刚,等.汽油辛烷值近红外光谱检测的改进极限学习机建模方法[J].南京理工大学学报,2017,41(5):660-665 HU Bixia,ZHANG Hongguang,LU Jiangang,et al.Novel modeling method based on improved extreme learning machine algorithm for gasoline octane number detection by near infrared spectroscopy[J].Journal of Nanjing University of Science and Technology,2017,41(5):660-665
-
[15] 郑斌,孙洪霞,王维民.基于随机森林回归的汽油研究法辛烷值预测[J].石油炼制与化工,2020,51(12):69-75 ZHENG Bin,SUN Hongxia,WANG Weimin.Prediction of gasoline research octane number based on random forest regression[J].Petroleum Processing and Petrochemicals,2020,51(12):69-75
-
[16] Kubic W L,Jenkins R W,Moore C M,et al.Artificial neural network based group contribution method for estimating cetane and octane numbers of hydrocarbons and oxygenated organic compounds[J].Industrial & Engineering Chemistry Research,2017,56(42):12236-12245
-
[17] Abdul J A G,van Oudenhoven V,Emwas A H,et al.Predicting octane number using nuclear magnetic resonance spectroscopy and artificial neural networks[J].Energy & Fuels,2018,32(5):6309-6329
-
[18] Razavi-Far R,Hallaji E,Farajzadeh-Zanjani M,et al.Information fusion and semi-supervised deep learning scheme for diagnosing gear faults in induction machine systems[J].IEEE Transactions on Industrial Electronics,2019,66(8):6331-6342
-
[19] Yang X B,Zheng X L,Gao H J.SGD-based adaptive NN control design for uncertain nonlinear systems[J].IEEE Transactions on Neural Networks and Learning Systems,2018,29(10):5071-5083
-
[20] Yuan X F,Huang B,Wang Y L,et al.Deep learning-based feature representation and its application for soft sensor modeling with variable-wise weighted SAE[J].IEEE Transactions on Industrial Informatics,2018,14(7):3235-3243
-
[21] 韩万龙,范峥,薛岗,等.利用BP人工神经网络预测天然气中重组分对净化装置的影响[J].石油与天然气化工,2018,47(6):1-6 HAN Wanlong,FAN Zheng,XUE Gang,et al.Effects prediction of heavy components in natural gas on purification unit by BP artificial neural network[J].Chemical Engineering of Oil & Gas,2018,47(6):1-6
-
摘要
为降低硫、烯烃含量及辛烷值损失,保证汽油清洁化生产,基于S Zorb装置运行积累的数据,首先利用Lasso算法初步筛选建模变量,并基于BP神经网络计算指标因子贡献度,进一步筛选出15个主要变量用于建立辛烷值损失预测模型;其次对比分析4种模型,得出BP神经网络预测精度更优,更适合作为辛烷值损失预测模型,并经过10折交叉验证得到均方误差(MSE)均值为0.027193,R2均值为0.90487,验证了该模型的可靠性;最后在控制油品硫质量分数不大于5 μg/g的前提下,结合多元线性回归对主要变量进行优化调控.结果表明,需同时改变多个变量才能使辛烷值损失降幅大于30%,多元线性回归模型预测精度较好,能按照一定比例对主要变量进行正反向调控.本文还可视化展示了优化过程中辛烷值和硫含量的变化轨迹.
Abstract
In order to reduce the sulfur and olefin and the loss of octane number so as to promote the clean production of gasoline,an octane number loss prediction model is established based on data accumulated by the S Zorb device.First,the Lasso is used to screen out the modeling variables,then the index factor contributions are calculated by the BP neural network,based on which 15 main variables are screened out to build the model.Second,four modeling approaches are compared and analyzed,which shows that the BP neural network has better prediction accuracy thus is more suitable to model the octane number loss.The ten-fold cross-validation produces the average MSE value of 0.027193 and the average R2 value of 0.90487,verifying the reliability of the model.Furthermore,the main variables are optimized and adjusted by multiple linear regression under the premise that the sulfur content is not greater than 5 μg/g.The results show that multiple variables need to be adjusted simultaneously to reduce the octane number loss by more than 30%.The multiple linear regression model has good prediction accuracy and can adjust main variables positively or negatively according to a certain proportion.The trajectories of octane number and sulfur content are also visualized in the paper.