-
0 引言
-
光伏发电过程具有随机性和不稳定性等特点,给电力系统的安全运行带来了巨大挑战.因此,提高光伏并网后电力系统的运行稳定性至关重要.精确地预测光伏发电功率对相关电力部门进行实时、准确的规划调度具有重要意义,可显著提高光伏电站的运行效率,为未来大规模光伏电站的稳定运行奠定了坚实基础[1].
-
目前,光伏功率预测方法主要分为物理预测方法和统计预测方法两类.物理预测方法通常使用精确的气象和环境信息数据建立复杂的物理模型进行预测,但容易受外界因素的影响[2].统计预测方法则利用光伏电站发电历史数据和天气预报数据进行分析处理,确定适用的预测模型和估计模型参数来预测光伏发电功率.常用的预测模型和算法包括支持向量机[3]、灰色预测模型[4]、神经网络[5-6]等自适应学习算法.近年来,应用人工智能技术进行光伏发电功率预测成为一个新的研究热点.文献[7]利用RF算法对光伏数据降维并利用XGBoost模型进行光伏发电功率预测,提高了数据有一定缺失情况时的鲁棒性,但对数据的筛选及天气的分类工作不足,其预测精度有限; 文献[8]提出一种支持向量机回归(SVR)短期光伏功率预测模型,利用大数据和mRMR技术进行输入特征降维,采用遗传算法对SVR机内的学习参数进行优化,从而提高了计算速度和预测精度; 文献[9]提出一种基于Bi-LSTM和注意机制光伏功率预测模型,引入了特征注意层和时间注意层来提高预测性能,但此方法的数据特征很少,并且只考虑气象因素作为输入源.由于单一预测模型存在预测精度低和稳定性差的问题,文献[10]提出一种CNN-LSTM-XGBoost预测模型,通过CNN进行特征提取,然后输入LSTM模型并采用误差倒数法与XGBoost模型组合进行预测,提高了预测精度,但网络参数采用经验匹配法,不能充分发挥模型性能.
-
为进一步提高光伏发电功率预测精度,本文提出一种基于卷积神经网络-门控循环单元(Convolutional Neural Network-Gated Recurrent Unit,CNN-GRU)和改进麻雀搜索算法(Improved Sparrow Search Algorithm,ISSA)优化的极限梯度提升(eXtreme Gradient Boosting,XGBoost)模型的短期光伏功率预测模型——CNN-GRU-ISSA-XGBoost.该方法首先使用主成分分析法(Principal Component Analysis,PCA)对各气象特征量进行特征选取,去除与光伏发电功率相关性较低的无用特征. 然后为GRU网络模型添加了CNN网络作为局部特征预提取模块,并利用ISSA对XGBoost模型超参数寻优,选取最优超参数以充分发挥模型性能.最后采用误差倒数法将CNN-GRU模型与ISSA-XGBoost组合,构成最终的光伏功率预测模型.将上述方法与支持向量机(SVM)、随机森林(RF)、长短时记忆网络(LSTM)、BP、CNN-GRU、CNN-GRU-SSA-XGBoot模型进行对比,仿真结果表明,本文所提方法具有更高的预测精度.
-
1 CNN-GRU模型
-
1.1 卷积神经网络
-
卷积神经网络(CNN)是一种经常用于图像、文本和信号输入的深度学习算法,由提取对象特征的堆叠层组成.CNN由卷积层、池化层和全连接层组成.卷积层是CNN中特征高效提取的关键,在本文中卷积层被主要应用于对光伏功率相关数据的特征提取.图1为CNN的基本架构.
-
图1 CNN基本架构
-
Fig.1 Basic architecture of CNN
-
1.2 GRU模型原理
-
门控循环单元(GRU)[11]是长短期记忆网络(LSTM)的一种变体,在学术界得到广泛应用.GRU采用复位门和更新门来克服长期依赖问题,并结合数据单元和隐藏层状态来解决梯度消失的问题.相较于LSTM,GRU网络仅含有两个门结构,减少了训练参数的数量.这使得GRU网络更易于收敛,减轻了LSTM网络的过度拟合问题,同时保持了LSTM网络在预测任务中的卓越性能.图2为GRU神经单元的结构.具体计算公式如下:
-
式中:zt表示更新门,主要用于遗忘和记忆; rt为复位门,用于确定是否将当前状态与先前信息合并; 表示中间记忆状态; Wz和Wr分别为更新门和复位门的连接权值; σ和tanh为激活功能.
-
图2 GRU神经单元的结构
-
Fig.2 Structure of GRU neural unit
-
1.3 CNN-GRU混合神经网络模型
-
本文提出的CNN-GRU混合结构如图3所示.在提出的结构中,CNN被用于特征进行序列表示,然后使用多层GRU进行有效的序列学习.CNN层被用于从输入的精细数据中提取空间特征,然后将其送入多层GRU.在本文中,使用两个具有Relu激活函数和核大小为2的CNN层,第一层和第二层的滤波器分别为1×16和1×8.提取空间特征后,将其输入到GRU层中.两个GRU层用于模拟时间特征,最后通过全连接层输出预测值.
-
图3 CNN-GRU网络结构
-
Fig.3 CNN-GRU network structure
-
在光伏功率预测中,通过CNN网络提取空间特征,再通过GRU网络提取时间特征,可以考虑到隐藏信息,获得较好的预测结果.然而,单一预测模型仍存在有限的精度和固有缺陷.为了弥补这些缺陷,本研究引入了模型组合思想,以获得具有良好预测能力的模型.经筛选,本文选择了XGBoost模型,因为它具有以下优势:1)使用GART作为基本分类器,更加灵活; 2)通过增加正则项控制复杂性,防止过拟合; 3)计算速度快,只依赖于输入数据值,不涉及具体损失函数.然而,XGBoost模型存在参数难以手动调节和随机性大的问题,所以引入麻雀优化算法(SSA)进行模型超参数寻优,但是基本麻雀搜索算法存在收敛速度慢、易陷入局部最优等问题,因此,本文在此基础上向发现者引入自适应参数,并向加入者引入Levy飞行融入到算法之中,进而提高算法的收敛速度和寻优能力.
-
2 改进麻雀搜索算法优化极限梯度提升模型
-
2.1 XGBoost模型原理
-
XGBoost是梯度提升树(Gradient Boosting)的一种增强和拓展[12].它通过整合一些弱分类器来构建一个强分类器.该算法的理念就是通过构建多个模型,来拟合训练数据中的目标变量.它会在每一次迭代中构建一个新的模型,以解决前一次迭代中模型存在的错误.XGBoost使用基于决策树的弱学习器(weak learners),以利用前面学习器的输出结果,来构建更强大的学习器.XGBoost通过运用提升算法来提升弱学习器的性能,并最终产生最优的预测结果.
-
在光伏发电功率预测的问题上,XGBoost使用的是基本回归树模型,其公式为
-
式中:xi为第i个输入特征向量; 为回归树的预测值; K为回归树的数量; fk为函数集合中的第一个函数; F为一组树的函数空间; 下标k代表这组回归树中的第k棵树.
-
为了学习到各回归树的回归函数,XGBoost回归器中的目标函数包含一个正则化项,定义目标损失函数为
-
式中:第一项为损失函数,表示预测值与实际值之间的误差; 第二项为正则化项,防止过拟合.
-
式中:T为回归树的叶数; ωj为叶子节点权重值第j个向量; γ和λ为惩罚系数,分别控制叶节点的数量和分数.
-
使用增量训练最小化目标函数,在第t次迭代时增加ft,更新目标函数如下:
-
在训练过程中,XGBoost生成树模型的分割准则使用贪心算法,使目标函数的增益为分割点的特征节点.
-
2.2 麻雀优化算法基本原理
-
麻雀搜索算法(SSA)是模仿生物界中麻雀种群捕食和防范天敌的行为,其觅食过程即寻优过程[13].
-
发现者的位置更新公式为
-
式中:Tmax为最大迭代次数; Xij(t)为第i只麻雀在第t次迭代处的第j维中的位置,j=1,2,3,···,d; α为[0,1]的随机变量; Q为正态分布的随机变量; L为1×d的矩阵; R2∈[0,1]表示预警值;TS∈[0.5,1]表示安全值.
-
加入者位置更新公式为
-
式中:Xworst(t)为最劣位置; Xpest(t)为最佳位置; A为1×d的矩阵; N为种群数量.
-
预警者位置更新公式为
-
式中:b为步长控制参数; M∈[-1,1]表示麻雀的飞行方向; fi,fw和fg分别代表整个种群中每个麻雀的适应度值、最差适应度值和最优适应度值; e为一个接近于零的常数.
-
2.3 改进麻雀优化算法ISSA
-
1)向生产者引入自适应超参数
-
整个麻雀种群的觅食区域和方向主要取决于发现者,因此需要扩大发现者的探索范围,以提高整个种群的觅食能力.所以向生产者引入自适应权值ε以提高发现者的搜索速度和全局搜索能力,公式为
-
式中:ε0=1为初始权重; c设置为0.8; Tmax为最大迭代次数.
-
在加入自适应权重ε后,将发现者的公式更新为
-
2)Levy飞行策略
-
Levy飞行策略[14]可以增加种群的多样性,克服过早收敛的问题.Levy飞行机制如下:
-
式中:NLF和MLF是服从高斯分布的随机数; β的值取为1.5; Γ(x)=(x-1)!为伽玛函数.
-
引入Levy飞行后加入者位置更新公式为
-
利用ISSA算法对XGBoost模型的超参数进行寻优,以提高XGBoost模型预测时的精准度与平稳性.因为此模型参数众多,对电脑配置要求过高,因此本文选取迭代次数、树的深度和学习率进行寻优.
-
3 基于CNN-GRU-ISSA-XGBoost的光伏功率预测方法
-
3.1 总体研究思路
-
为了提高光伏发电功率预测的精度,本文提出一种基于CNN-GRU-ISSA-XGBoost组合模型的光伏功率预测方法,该方法能够有效地提升预测的准确性.预测模型的流程如图4所示,具体步骤如下:
-
1)数据预处理.针对光伏功率及其他相关特征因素数据,采用3α法对所有数据进行异常值检测,建立完整无异常的数据集用于预测模型.
-
2)特征选择.对于异常值检测后的数据集采用PCA对与光伏功率相关的各类特征因素进行筛选降维,综合考虑相关系数和贡献值选出相关性高的特征因素作为ISSA-XGBoost模型和CNN-GRU模型的输入变量.
-
3)模型训练.采用在发现者处引入自适应参数及在加入者处引入Levy飞行的改进麻雀搜索优化算法对XGBoost模型的关键参数进行优化,包括迭代次数、学习率和树的最大深度等,最终得到全局最优解.
-
图4 CNN-GRU-ISSA-XGBoost组合模型流程
-
Fig.4 Flow chart of the combined model of CNN-GRU-ISSA-XGBoost
-
4)模型预测.将具有高相关性的特征输入到ISSA-XGBoost预测模型和CNN-GRU模型中,得到它们各自的预测结果和预测误差.然后,利用误差倒数法对这两个模型的预测结果进行加权组合,以获得最终的预测结果.
-
5)性能评估.根据误差分析对预测结果进行分析,并与其他预测方法进行比较.
-
3.2 CNN-GRU-ISSA-XGBoost模型组合
-
光伏功率具有随机性及波动性大的特点,单一预测模型往往难以准确分析历史数据波动规律,从而导致预测精度不高.因此,本文采用倒数误差法对模型进行权重赋值.根据该方法,通过主要评价指标绝对百分比误差(MAPE)得到的误差结果计算CNN-GRU和ISSA-XGBoost的权重.因此,在该组合模型中,误差较小的预测模型被赋予较大的权重.因此,可以显著降低组合预测模型的整体误差.为了确定权重系数,误差倒数法的公式如下:
-
式中:e1为CNN-GRU模型的预测误差; e2为ISSA-XGBoost模型的预测误差.
-
4 实验评估
-
本文使用2018年光伏电站人工智能数据处理分析大赛的原始数据集(数据集可向本文通信作者获取),包括发电功率、光照强度、板温、现场温度、风速和风向等影响因子,选用每隔15 min进行采样的9 000个连续数据.经过异常值检测、归一化以及PCA特征选取,最终选用光照强度、板温和风速作为ISSA-XGBoost模型和CNN-GRU模型的输入.在原始数据样本中选取70%作为训练集,30%为测试集.
-
4.1 PCA特征选择
-
主成分析法(PCA)是统计学中一种常用的多维数据降维的方法,它从多维特征中选取与主成分相关性较高的一组新特征,得出各特征间的相关系数[15-16].在光伏发电方面,通过对原始数据进行PCA分析,可以去除与光伏发电功率相关性较低的无用特征,进一步提高预测精度.本文使用光照强度、板温、现场温度、风速和风向等多种特征来创建新的数据序列,并使用PCA对其进行分析.表1显示了这些特征与光伏发电功率之间的相关系数.根据PCA分析结果,确定了各成分的特征值和贡献率,如表2所示.
-
根据表1和表2的数据得出光照强度、板温与光伏功率之间存在着最大的正相关性,与风速呈中等相关性,现场温度与光伏功率之间的相关性较低,而风向与光伏功率之间则呈现出较低的负相关性.基于上述讨论,本文选择光照强度、板温和风速作为预测模型的输入变量,基本覆盖了预测中所需的影响因素.
-
4.2 误差性能指标
-
本文选取均方根误差(RMSE)和绝对百分比误差(MAPE)来评估模型的预测性能.其公式如下:
-
式中: 和yi分别为第i个光伏功率样本的预测值和真实值; N为样本个数.
-
4.3 仿真实验
-
将改进麻雀算法ISSA与麻雀算法SSA进行对比,迭代次数及适应度值变化如图5所示.将CNN-GRU-ISSA-XGBoost组合模型与主流的机器学习SVM模型、RF模型以及主流的深度学习LSTM模型、BP模型进行对比,上述模型的光伏功率预测精度对比曲线如图6所示.在此基础上,增添一组消融实验,将CNN-GRU-ISSA-XGBoost组合模型与CNN-GRU模型、XGBoost模型和CNN-GRU-SSA-XGBoost模型的光伏功率预测精度进行对比,消融实验模型的光伏功率预测精度对比曲线如图7所示.为了降低随机性对预测性能的影响,每个模型在相同的实验参数设置和数据集划分条件下分别经过40次单独运行,以取得各个误差指标的平均值.各个模型的具体误差分析RMSE、MAPE值如表3所示.
-
经过多次的实验验证,SSA和ISSA算法的最大迭代次数Tmax=1 000,种群数量N=30.由图5两种算法的迭代收敛曲线可知,ISSA表现出了比SSA更好的收敛精度和寻优效果.ISSA仅有3次左右陷入局部最优,而SSA则分别陷入了14次左右局部最优.SSA算法100次迭代左右达到最优解,而ISSA仅需20次迭代左右就可达到最优解,并且最优适应度值低于SSA算法.该结果表明对SSA算法的改进具有很好的效果.
-
图5 迭代收敛曲线
-
Fig.5 Iterative convergence curves
-
由图6各模型光伏功率预测精度对比曲线可以看出,CNN-GRU-ISSA-XGBoost组合模型相较于其他模型在光伏功率预测上有着更高的预测精度.根据局部放大图6的结果可知,BP和LSTM的预测结果都存在显著的偏差,无法准确反映光伏功率的变化趋势,而SVM、RF和CNN-GRU-ISSA-XGBoost模型误差波动较小,跟踪性能较好,能很好地反映出光伏发电功率的变化趋势.根据表3定量分析预测结果,可以看出本文所提模型相较于SVM、RF模型的MAPE分别降低约55.7%、47.3%,RMSE分别降低约27%、25.7%.因此,本文所提模型优于所有对比方法,有着更高的预测精度.
-
根据图7消融实验模型的光伏功率预测精度对比曲线和表3的误差统计数据,可以看出通过组合模型和ISSA算法进行超参数寻优后的光伏功率预测模型相较于传统的XGBoost模型和CNN-GRU模型在光伏功率预测上有着更高的预测精度.从图7局部放大图上可以看出,在一些变化较剧烈的时刻,CNN-GRU-ISSA-XGBoost模型相较于CNN-GRU-SSA-XGBoost模型的预测曲线与实际曲线变化趋势具有显著的一致性.说明改进后的麻雀搜索算法提高了参数寻优能力和预测精度.同时,CNN-GRU-ISSA-XGBoost模型的MAPE、RMSE分别为2.07%和0.201 2,比其他模型更小,因此,结合上述实验结果,可以得出CNN-GRU-ISSA-XGBoost组合模型具有更高的预测精度.
-
图6 各种方法预测结果对比
-
Fig.6 Comparison of prediction results by various methods
-
图7 消融实验预测结果对比
-
Fig.7 Comparison of predicted results of ablation experiments
-
5 结论
-
为了提高光伏功率预测的准确性,本研究提出了一种基于CNN-GRU-ISSA-XGBoost的短期光伏功率预测模型,并得到以下结论:
-
1)采用主成分分析(PCA)对与光伏功率相关的气象特征进行筛选和降维,综合考虑相关系数和贡献值,选取与光伏功率具有高相关性的特征因素作为输入变量.这种降维方法有效地减少了输入的维度,从而缩短了计算时间.
-
2)针对XGBoost模型手动配置参数困难、随机性大导致预测精度较低的问题,本研究引入了改进的麻雀搜索算法(ISSA)来寻优模型的超参数.实验结果显示,相对于传统的麻雀搜索算法(SSA),ISSA算法具有更强的寻优能力,能够为XGBoost模型找到更优的参数组合,从而有效地提升了模型的预测性能.
-
3)基于CNN-GRU-ISSA-XGBoost组合模型能够综合各个模型的优点,有效地减小了样本随机性对单一模型的影响,从而提高了光伏功率预测的准确性和稳定性.通过与多种单一模型及组合模型进行对比实验,研究结果表明,本研究提出的方法具有较高的预测精度.
-
综上所述,本研究提出的基于CNN-GRU-ISSA-XGBoost的光伏功率预测模型在提高预测准确性方面取得良好的效果,为光伏发电系统的运行和管理提供了一种可行的预测方法.
-
参考文献
-
[1] 王珊珊,吴霓,何嘉文,等.基于改进Stacking与误差修正的短期太阳辐照度预测[J].南京信息工程大学学报(自然科学版),2023,15(6):684-691.WANG Shanshan,WU Ni,HE Jiawen,et al.Short-term solar irradiance prediction based on improved Stacking and error correction[J].Journal of Nanjing University of Information Science & Technology(Natural Science Edition),2023,15(6):684-691
-
[2] 柴闵康,夏飞,张浩,等.基于云图特征自识别的光伏超短期预测模型[J].电网技术,2021,45(3):1023-1035.CHAI Minkang,XIA Fei,ZHANG Hao,et al.Ultra-short-term prediction of self-identifying photovoltaic based on sky cloud chart[J].Power System Technology,2021,45(3):1023-1035
-
[3] 胡乙丹,姜吉祥,董霞.基于结合聚类与SVM参数寻优的短期电力负荷预测方法[J].电力信息与通信技术,2022,20(5):54-60.HU Yidan,JIANG Jixiang,DONG Xia.A short-term power load forecasting method based on combining clustering and SVM parameter optimization[J].Electric Power Information and Communication Technology,2022,20(5):54-60
-
[4] Ding S,Li R J,Tao Z.A novel adaptive discrete grey model with time-varying parameters for long-term photovoltaic power generation forecasting[J].Energy Conversion and Management,2021,227:113644
-
[5] 韩祥民,刘晓波,刘敏,等.基于改进EEMD与GA-BP的谐振接地故障选线方法[J].智慧电力,2021,49(12):80-87.HAN Xiangmin,LIU Xiaobo,LIU Min,et al.Resonant grounding fault line selection method based on improved EEMD and GA-BP model[J].Smart Power,2021,49(12):80-87
-
[6] 孙东磊,王艳,于一潇,等.基于BP神经网络的短期光伏集群功率区间预测[J].山东大学学报(工学版),2020,50(5):70-76.SUN Donglei,WANG Yan,YU Yixiao,et al.Interval prediction of short-term regional photovoltaic power based on BP neural network[J].Journal of Shandong University(Engineering Science),2020,50(5):70-76
-
[7] 葛浩然,夏宇,邹文进,等.基于RF-XGBoost的光伏发电功率预测[J].电气自动化,2022,44(5):12-15.GE Haoran,XIA Yu,ZOU Wenjin,et al.Prediction of photovoltaic power generation based on RF-XGBoost[J].Electrical Automation,2022,44(5):12-15
-
[8] Liu J,Sun H W,Chang P,et al.Research of photovoltaic power forecasting based on big data and mRMR feature reduction[C]//2018 IEEE Power & Energy Society General Meeting(PESGM).August 5-10,2018,Portland,OR,USA.IEEE,2018:1-5
-
[9] He B,Ma R Z,Zhang W W,et al.An improved generating energy prediction method based on Bi-LSTM and attention mechanism[J].Electronics,2022,11(12):1885
-
[10] 汤德清,朱武,侯林超.基于CNN-LSTM-XGBoost模型的超短期光伏功率预测[J].电源技术,2022,46(9):1048-1052.TANG Deqing,ZHU Wu,HOU Linchao.Ultra-short-term photovoltaic power prediction based on CNN-LSTM-XGBoost model[J].Chinese Journal of Power Sources,2022,46(9):1048-1052
-
[11] Khortsriwong N,Boonraksa P,Boonraksa T,et al.Performance of deep learning techniques for forecasting PV power generation:a case study on a 1.5 MWp floating PV power plant[J].Energies,2023,16(5):2119
-
[12] Qian N,Wang X S,Fu Y C,et al.Predicting heat transfer of oscillating heat pipes for machining processes based on extreme gradient boosting algorithm[J].Applied Thermal Engineering,2020,164:114521
-
[13] Xue J K,Shen B.A novel swarm intelligence optimization approach:sparrow search algorithm[J].Systems Science & Control Engineering,2020,8(1):22-34
-
[14] Jensi R,Jiji G W.An enhanced particle swarm optimization with levy flight for global optimization[J].Applied Soft Computing,2016,43:248-261
-
[15] 李杨,蓝茂蔚,赵国钦,等.基于PCA-PSO-LSSVM的电站锅炉效率预测模型研究[J].热力发电,2021,50(12):43-50.LI Yang,LAN Maowei,ZHAO Guoqin,et al.Study on prediction model of utility boiler efficiency based on PCA-PSO-LSSVM[J].Thermal Power Generation,2021,50(12):43-50
-
[16] 邬程欢,贺民,龚明波,等.基于极限区间与改进PCA-SOM的电气运行参数对专变健康影响的量化评价方法[J].电力系统保护与控制,2021,49(17):101-108.WU Chenghuan,HE Min,GONG Mingbo,et al.Quantitative evaluation based on limit interval and improved PCA-SOM of electrical operating parameter health status of a special transformer[J].Power System Protection and Control,2021,49(17):101-108
-
摘要
针对光伏功率随机性及波动性大,单一预测模型往往难以准确分析历史数据波动规律,从而导致预测精度不高的问题,提出一种基于卷积神经网络-门控循环单元(CNN-GRU)和改进麻雀搜索算法(ISSA)优化的极限梯度提升(XGBoost)模型的短期光伏功率预测组合模型.首先去除历史数据中的异常值并对其进行归一化处理,利用主成分分析法(PCA)进行特征选取,以便更好地识别影响光伏功率的关键因素.然后采用CNN网络提取数据的空间特征,再经过GRU网络提取时间特征,针对XGBoost模型手动配置参数困难、随机性大的问题,利用ISSA对模型超参数寻优.最后对两种方法预测的结果用误差倒数法减小误差的同时对权重进行更新,得到新的预测值,从而完成对光伏功率的预测.实验结果表明,所提出的CNN-GRU-ISSA-XGBoost组合模型具有更强的适应性和更高的精度.
Abstract
The high randomness and volatility of photovoltaic (PV) power makes it difficult for single prediction models to accurately analyze the fluctuation patterns in historical data,resulting in low prediction accuracy.To address this issue,a combined model for short-term PV power prediction was proposed,which incorporated Convolutional Neural Network,Gated Recurrent Unit (CNN-GRU) and an Improved Sparrow Search Algorithm (ISSA) for optimizing the eXtreme Gradient Boosting (XGBoost) model.First,the historical data were normalized after outlier removal,and feature selection was carried out via Principal Component Analysis (PCA) so as to better identify the key factors affecting photovoltaic power.Then,the CNN and GRU networks were used to extract the spatial and temporal features of the data,respectively.To address the difficulty in manually configuring parameters and high randomness of the XGBoost model,ISSA was used to optimize the hyperparameters of the model.Finally,the reciprocal error method was used to reduce the error of the results predicted by the two methods (CNN-GRU and ISSA-XGBoost) while the weights were updated to obtain new predicted values to complete the prediction of photovoltaic power.The experimental results show that the proposed CNN-GRU-ISSA-XGBoost model has strong adaptability and high accuracy.