-
0 引言
-
准确的水库水位预测[1-2]对当地开展防洪减灾工作具有重要指导作用.多年来,诸多学者期望使用水动力学模型[3-4]来模拟渠道水流,达到对水位预测的效果.然而,基于水动力学模型的预测需要模拟出当地精确的地形资料、准确的实测数据等大量人力测量的输入数据,同时模型需要大量参数调整,极大地影响着水位监测的准确性.
-
机器学习模型通过挖掘输入数据隐藏特征便可做出预测,可以有效避免水动力学模型的缺陷.王蒙蒙等[5]提出一种基于支持向量回归(Support Vector Regression,SVR)的洞庭湖水位预测模型,相比传统水动力学模型精度更高.SVR模型对处理非线性问题很难找到合适的核函数且拟合率不高,而深度学习中长短时记忆网络(Long Short-Term Memory,LSTM)在处理非线性序列数据方面优势明显[6-7].刘亚新等[8]提出一种基于LSTM的短期水位预测模型.唐鸣等[9]考虑到迭代次数对计算效率的影响,建立了三层LSTM模型应用于南水北调中线京石段闸前水位预测.Chung等[10]在不同应用场景下对递归神经网络中不同的递归单元进行比较后发现,相比于LSTM,门控循环单元(Gate Recurrent Unit,GRU)也能达到相当的效果,且计算量更小.计算效率更高.纪国良等[11]指出,在水库水位预测中GRU要优于LSTM.
-
单一模型存在特征提取不完备的缺陷,多个预测方法结合可以提高预测精度.周勇强等[12]将LSTM与卷积神经网络(Convolutional Neural Networks,CNN)相结合,同时捕捉水位数据的局部特征和时序特征,有效地提高了预测准确率.另外,考虑到水位数据非线性和不稳定性,时频分析中经验模态分解(Empirical Mode Decomposition,EMD)[13]、集合经验模态分解(EEMD)、完全集合经验模态分解(CEEMDAN)和变分模态分解(Variational Mode Decomposition,VMD)[14]等被应用于水位预测的预处理中,分解后的数据更加平稳,降低了噪声对水位数据的影响,有利于提高水位预测精度.
-
为解决非线性、不稳定性以及复杂的时空特性对水库水位时间序列的影响,本文提出一种基于VMD-CNN-GRU的水库日水位预测模型.其中,VMD消除水位数据的噪声,CNN有效提取水位数据的局部特征[15],GRU提取水位数据的深层时间特征.选取辽宁省辽阳县葠窝水库2000—2009年3 652 d水位数据进行实例研究.与多个相关模型对比分析表明,本文模型在选取的预测精度评价指标上均表现最佳.分解模块分析表明,VMD与EMD、EEMD和CEEMDAN相比,纳什系数(Nash-Sutcliffe Efficiency coefficient,NSE)提升大于6%,均方根误差(RMSE)降低73.06%以上,平均绝对误差(MAE)降低74.24%以上.选用GRU模块的训练时间比LSTM模块在运算效率方面提升23.71%.本文模型预测精度高、运算效率高,更适合实际水库水位实时调度的需求.
-
1 基本原理
-
1.1 VMD原理
-
与其他时频分解方法相比,VMD可以有效降低复杂度高和非线性强的水库水位时间序列的非平稳性.VMD具体步骤如下:
-
1)构造变分问题
-
其中:式(2)是关于{uk},{ωk}的多元函数,式(3)为各模态的约束条件.f是初始信号,K是分解模态的个数,{uk},{ωk}分别是分解后的第k个模态分量和中心频率,δt为狄拉克函数,*为卷积运算,为原始信号的指数信号,为偏导运算,t为时间变量,j为虚数符号.
-
2)求解变分问题
-
其中,λ为拉格朗日乘法算子,α为二次惩罚因子,〈·〉为内积运算,‖·‖22 表示L2范数的平方.
-
3)求各模态分量和中心频率
-
通过搜寻增广拉格朗日函数的鞍点,交替寻找迭代后的{uk},{ωk}和λ的最优结果,其表达式如下:
-
其中,为 的维纳滤波,为此过程的模态函数功率谱的重心,γ为噪声容忍度,和分别是原信号对应的傅里叶变换,n表示迭代次数.
-
1.2 CNN原理
-
CNN在本质上是一种输入与输出间的映射关系.CNN所包含的权值共享特点降低了网络的复杂性,避免了特征提取和分类过程中数据重建的复杂度.CNN网络特有的局部感知野使得每个神经元只需对局部特征进行感知,然后在更高层将局部的信息综合就可得到全局信息.
-
设x=(x1,x2,···,xn)为时间序列数据输入向量,n为每个窗口数值数量,xi为归一值,i为特征值索引,j为每个数据窗口的特征图索引.利用输入数据的数值,第l个卷积层的输出值可表示为
-
式中, 表示第j个特征图的偏置,W为核权重,M为过滤器大小,σ为激活函数.
-
池化层降低表征的空间尺寸,以减少网络的参数量和计算复杂度,同时可以防止过拟合.池化层的计算可表示为
-
式中,R为池化大小(R<y),T为确定池化区域步长,表示池化后的神经元值.
-
1.3 GRU原理
-
GRU混合了细胞状态和隐藏状态,将LSTM中的遗忘门和输入门合并为一个单一的更新门,其结构如图1所示.相比LSTM模型,GRU的结构更加简单.其中:xt为t时刻的输入; yt为t时刻隐藏节点的输出; ht为传递给下一个节点的隐藏状态; ht-1为t-1时刻的隐藏层状态,该隐藏层状态包含了之前节点的相关信息; rt为重置门; zt为更新门; σ为sigmoid函数; tanh为激活函数,将数值限制在-1~1之间; 为候选隐藏层状态.
-
GRU的数学原理如下:
-
图1 GRU网络结构
-
Fig.1 GRU network structure
-
其中:Wxr,Whr,Wxz,Whz,Whx,Whh表示输入向量与重置门、更新门和候选隐藏层状态之间相对应的权向量; br,bz,bh是偏置变量; ⊙表示按元素相乘.
-
2 模型建立
-
2.1 模型的输入及输出
-
目前,过程驱动模型与数据驱动模型被广泛运用于时间序列的预测.本文建立的VMD-CNN-GRU模型属于数据驱动模型方法的一种,有效避免了传统过程驱动模型需要进行过程近似模拟、大量未知输入数据以及模型参数的缺陷,同时兼备计算速度快、输入参数少且不需考量中间过程的物理机制的优点,只需要寻求输入输出变量间的最佳映射关系.本文模型与现有模型相比具有较强的数据处理和映射功能,仅需将采集到的水库水位数据作为输入向量按比例划分后直接输入模型进行学习、映射,得到输出向量.从预报成果来说,预报方案满足《水文情报预报规范》(GB/T22482—2008)[16]要求,并取得理想的成果,可应用于实际预测.
-
2.2 基于VMD-CNN-GRU的水库水位预测模型
-
VMD-CNN-GRU水库水位预测混合模型具体参数如表1所示.
-
VMD-CNN-GRU水库水位预测混合模型整体结构如图2所示.
-
VMD-CMM-GRU水位预测模型具体运算步骤如下:
-
1)步骤1:数据预处理
-
① 缺失数据补足
-
根据数据缺失特征,选择相应的数据缺失方法进行数据补足.
-
图2 VMD-CNN-GRU水位预测模型整体结构
-
Fig.2 Overall structure of VMD-CNN-GRU water level prediction model
-
② 基于自适应变分模态分解的数据处理
-
EMD算法具有不需要人为设置和干预的自适应性,对未知数据无需进行分析研究,直接对其进行循环迭代,便可将原始混合信号x分解成n个模态,n个模态又被分为n-1个子信号和1个残差项,其目标函数式为
-
式中,x为原信号,ui为第i个IMF分量,ri为第i个去掉高频成分的新信号.
-
对补全后的水位数据进行排列并按照比例划分构建为列表数据,再将划分好的数据输入到VMD进行分解预处理.结合EMD分解自适应性优势,获取最优分解模态数,将其作为VMD分解模态数K值.自适应VMD分解模块能够将序列中隐藏的周期和趋势进行有效挖掘,使得模型能够学习到水位数据周期性的隐藏特征,同时增加数据量,使模型充分进行学习,有效提高预测准确率,模态分解如图3所示.
-
图3 模态分解
-
Fig.3 Modal decomposition
-
③ 数据归一化处理
-
对划分好的数据进行归一化处理,其计算方法如下:
-
其中,x表示模型的输入值,x′表示归一化后的数值.
-
2)步骤2:基于CNN的水位局部特征提取
-
CNN的卷积核强调空间中的“窗口”,使得其在处理时间序列数据时可以考虑到当前数据前后数据的影响,从而进行局部数据特征提取,最后将局部信息聚合得到整体信息.引入的CNN层可以有效弥补循环神经网络不考虑空间上下问题,对输入数据进行层次特征提取.
-
CNN层用于水位的局部感知提取特征,可以减少参数量和连接数,从而显著提高模型迭代的效率,为进一步利用循环神经网络提取深层时间特征奠定了基础.
-
将经过预处理后的数据构建为S×τ×D的三维向量作为CNN层的输入.其中,S为样本数量(samples),τ为时间步长(timesteps),D为特征个数(features).数据通过输入层进入卷积层,卷积层包含数个特征面,每个特征面包含数个神经元,对数据进行特征提取.提取到的特征由激活函数处理得到神经元的输出,输入到池化层中.池化层与卷积层相同,包含数个特征面,池化层主要用于二次特征提取、简化数据量并利用其每个神经元进行采样.
-
3)步骤3:基于GRU的水位时间特征提取
-
将经过CNN层提取局部特征后的水位数据重构为数据长度×批次大小×通道数的三维数组,并输入GRU网络进行深层时间特征提取.在层与层之间添加了Dropout机制退出部分神经元,确定随机丢弃比例P值,以防止模型过拟合.在训练过程中,选取可为不同参数设置不同学习率的Adam算法对模型参数进行优化.
-
4)步骤4:输出水位预测结果
-
将提取到的深层特征输入到第1层Dense层进行降维处理,再将处理过的数据输入到包含Relu激活函数的第2层Dense层进行预测输出.
-
2.3 模型评价指标
-
为验证本文提出的模型的有效性,选择RMSE、MAE、MAPE(平均绝对百分比误差)和NSE为评价指标.
-
式中,yi表示实际值,表示预测值,表示真实值的平均值.
-
根据《水文情报预报规范》(GB/T22482—2008)相关规定:当0.90≤NSE时,预测精度等级为甲级; 0.70≤NSE<0.90时,预测精度等级为乙级; 0.50≤NSE<0.70时,预测精度等级为丙级; NSE<0.50时,预测结果不可信.
-
3 实例分析
-
3.1 研究区域
-
葠窝水库是太子河流域内主要的控制性工程(图4),水库坝址位于辽阳市弓长岭区安平乡境内太子河干流中部,在本溪与辽阳之间,距辽阳市39 km,坝址地理位置为123°31′E,41°14′N.葠窝水库是一座以防洪、灌溉、工业供水为主,兼顾发电的大型水利枢纽工程.
-
图4 太子河流域水文站网分布
-
Fig.4 Water network distribution of hydrological stations in Taizi River basin
-
3.2 研究数据
-
本文采用葠窝水库2000—2009年共3 652 d水位数据为例进行实证研究,采集到的数据均为当天相同时间点水库站点水位,为单特征数据.将该数据集按照9∶1的比例划分,前3 285 d水位数据作为训练集,后366 d水位数据作为测试集.本文模型以及对比模型均在此训练集、测试集上进行验证.
-
由原始数据图像(图5)可见,数据存在缺失的情况,并属于完全随机缺失.本文采用平均值填充法,根据每年同时期水位数据取平均值来填补该缺失的属性值,填充后的数据如图6所示.
-
4 结果与分析
-
4.1 精度对比分析
-
1)与现有模型的对比分析
-
本文模型与现有模型关于所有评价指标的对比如表2所示.由表2可知,本文模型相较于基线模型SVR,RMSE降低87.95%,MAE降低90.13%,MAPE降低91.72%,NSE提升32.12%.本文模型与现有基于深度学习模型LSTM、GRU、CNN-LSTM、EMD-LSTM相比:RMSE分别降低81.23%、79.71%、78.69%和75.69%; MAE分别降低86.34%、85.46%、84.42%和82.11%; MAPE分别降低85.58%、84.35%、83.55%和82.51%; NSE分别提升13.03%、11.03%、9.96%和7.54%.另外,GRU的4个评价指标上均优于LSTM.
-
图5 葠窝水库2000—2009年日水位原始数据
-
Fig.5 Original data of daily water level of Shenwo reservoir from 2000 to 2009
-
图6 补全缺失值后的数据
-
Fig.6 Data after completing missing values
-
表2还表明,单一模型预测效果明显低于组合模型.单一模型表现最好的GRU只达到乙级可信度标准,不符合水库水位预测的实际需要.
-
为了进一步说明本文模型优势,对预测结果进行可视化处理,如图7所示.
-
图7 本文模型与现有模型预测效果对比
-
Fig.7 Comparison of prediction performance between the proposed model and existing models
-
由图7a清晰可见,SVR模型对处理非线性问题时,可以模拟出预测数据的大致走向,但在精确度方面有很大的提升空间.由图7b可见,单一模型不能捕捉非线性时间序列的局部特征,受特殊极值点影响较大,导致预测结果明显偏离原始数据.由图7c可见,引入CNN提取局部特征和引入EMD分解进行数据预处理,使得LSTM模型在一定程度上消除了极大值点对模型预测的影响.所以,本文模型选取的VMD分解可以使每个模态调整到基带后比EMD更加平滑,选取的CNN提取局部特征后,可以有效消除特殊极值对最终预测结果的影响,达到最优拟合效果.
-
2)与消融模型的对比分析
-
为分析本文组合模型中不同模块的必要性,将本文模型进行消融分析(表3).表3显示:与CNN-GRU相比,由于VMD的引入,NSE提升大于8%,效果显著; 与VMD-GRU相比,CNN通过提取水位数据的局部特征,使得RMSE降低59.04%,MAE降低69.61%,MAPE降低69.72%,NSE提升2.35%.
-
4.2 分解算法对比分析
-
将本文选择的VMD分解方法与其他3种分解方法(EMD、EEMD和CEEMDAN)进行对比分析(表4).由表4可见,加入VMD分解的模型效果最好,与另外3种分解方式对比,NSE提升大于6%,RMSE降低73.06%以上,MAE降低74.24%以上,MAPE降低76.25%以上.所以,本文选择VMD更适合水库水位的去噪声处理.
-
4.3 运算效率分析
-
模型运算效率通常作为评价模型好坏的参考之一,在训练效果都达到最优的情况下,将NSE大于0.95的模型运算效率进行实验对比,具体结果如表5所示.由表5可以看出,在相同训练集下,引入GRU模块相较于引入LSTM,RMSE降低19.57%,MAE降低32.08%,MAPE降低32.65%,NSE提升0.26%,运算效率提升23.71%.进一步说明,GRU比LSTM有更简单的门结构,可以大大减少模型训练时间.综合考虑上述对预测精度的分析,在训练数据量不大的数据集时,GRU模型的学习能力更优于LSTM模型.
-
5 结论
-
由于非线性和不稳定性对水库水位预测精度的影响,单一模型无法进行精准预测,本文提出基于VMD-CNN-GRU的水库水位混合模型.其中:VMD分解可以有效减少中心频率混叠的问题,使得数据更加平稳的同时增加数据量,使得深度学习模型能够充分学习到数据特征,提高了模型的精度; 引入 CNN模型进行局部感知提取特征,提高了模型的迭代效率,同时减小了模型受极值点的影响; 与GRU相结合进一步提取高层次特征,将原始数据中的特征进行充分挖掘.实例分析结果表明,与现有模型相比,本文模型具有较高的预测精度和运算效率,验证了本文模型的适用性和有效性.
-
参考文献
-
[1] 刘威,尹飞.一种基于LSTM模型的水库水位预测方法[J].无线电工程,2022,52(1):83-87.LIU Wei,YIN Fei.A reservoir water level prediction method based on LSTM model[J].Radio Engineering,2022,52(1):83-87
-
[2] 谷建永,田斌.考虑库水位与间歇性降雨联合作用的库区古滑坡稳定性研究[J].中国农村水利水电,2022(9):188-194.GU Jianyong,TIAN Bin.Numerical analysis of landslide stability in reservoir area considering combined effect of reservoir water level and intermittent rainfall[J].China Rural Water and Hydropower,2022(9):188-194
-
[3] Pramanik N,Panda R K,Sen D.One dimensional hydrodynamic modeling of river flow using DEM extracted river cross-sections[J].Water Resources Management,2010,24(5):835-852
-
[4] Lai X J,Liang Q H,Jiang J H,et al.Impoundment effects of the three-gorges-dam on flow regimes in two China’s largest freshwater lakes[J].Water Resources Management,2014,28(14):5111-5124
-
[5] 王蒙蒙,戴凌全,戴会超,等.基于支持向量回归的洞庭湖水位快速预测[J].排灌机械工程学报,2017,35(11):954-961.WANG Mengmeng,DAI Lingquan,DAI Huichao,et al.Support vector regression based model for predicting water level of Dongting Lake[J].Journal of Drainage and Irrigation Machinery Engineering,2017,35(11):954-961
-
[6] 郭燕,赖锡军.基于循环神经网络的洞庭湖水位预测研究[J].长江流域资源与环境,2021,30(3):689-698.GUO Yan,LAI Xijun.Research on water level prediction of Dongting Lake based on recurrent neural network[J].Resources and Environment in the Yangtze Basin,2021,30(3):689-698
-
[7] 郭佳丽,邢双云,栾昊,等.基于改进的LSTM算法的时间序列流量预测[J].南京信息工程大学学报(自然科学版),2021,13(5):571-575.GUO Jiali,XING Shuangyun,LUAN Hao,et al.Prediction of time series traffic based on improved LSTM algorithm[J].Journal of Nanjing University of Information Science & Technology(Natural Science Edition),2021,13(5):571-575
-
[8] 刘亚新,樊启祥,尚毅梓,等.基于LSTM神经网络的水电站短期水位预测方法[J].水利水电科技进展,2019,39(2):56-60,78.LIU Yaxin,FAN Qixiang,SHANG Yizi,et al.Short-term water level prediction method for hydropower station based on LSTM neural network[J].Advances in Science and Technology of Water Resources,2019,39(2):56-60,78
-
[9] 唐鸣,雷晓辉,龙岩,等.基于长短时记忆网络(LSTM)的南水北调中线水位预测[J].中国农村水利水电,2020(10):189-193.TANG Ming,LEI Xiaohui,LONG Yan,et al.Water level forecasting in middle route of the south-to-north water diversion project(MRP)based on long short-term memory(LSTM)[J].China Rural Water and Hydropower,2020(10):189-193
-
[10] Chung J,Gulcehre C,Cho K H,et al.Empirical evaluation of gated recurrent neural networks on sequence modeling[J].arXiv e-print,2014,arXiv:1412.3555
-
[11] 纪国良,周曼,刘涛,等.基于循环神经网络的水库水位预测方法[J].长江科学院院报,2022,39(3):80-85.JI Guoliang,ZHOU Man,LIU Tao,et al.Predicting water level for large reservoirs using recurrent neural network[J].Journal of Yangtze River Scientific Research Institute,2022,39(3):80-85
-
[12] 周勇强,朱跃龙.基于SFLA-CNN和LSTM组合模型的水位预测[J].计算机与现代化,2021(4):1-7.ZHOU Yongqiang,ZHU Yuelong.Water level prediction based on SFLA-CNN and LSTM combined model[J].Computer and Modernization,2021(4):1-7
-
[13] 王亦斌,孙涛,梁雪春,等.基于EMD-LSTM模型的河流水量水位预测[J].水利水电科技进展,2020,40(6):40-47.WANG Yibin,SUN Tao,LIANG Xuechun,et al.Prediction of river water flow and water level based on EMD-LSTM model[J].Advances in Science and Technology of Water Resources,2020,40(6):40-47
-
[14] Qian Z,Pei Y,Zareipour H,et al.A review and discussion of decomposition-based hybrid models for wind energy forecasting applications[J].Applied Energy,2019,235:939-953
-
[15] 陈晓平,陈易旺,施建华.基于机器学习的降雨量雷达回波数据建模与预测[J].南京信息工程大学学报(自然科学版),2020,12(4):483-494.CHEN Xiaoping,CHEN Yiwang,SHI Jianhua.Rainfall modeling and prediction by radar echo data based on machine learning[J].Journal of Nanjing University of Information Science & Technology(Natural Science Edition),2020,12(4):483-494
-
[16] 水文情报预报规范:GB/T 22482—2008 [S].北京:中国标准出版社,2008
-
摘要
水库水位预测为其运营、防洪、水资源调度管理提供了重要决策支持.准确可靠的预测对水资源的优化管理起着至关重要的作用.针对水库水位数据的非线性、不稳定性以及复杂的时空特性,提出一种融合自适应变分模态分解(VMD)、卷积神经网络(CNN)和门控循环单元(GRU)的混合水库水位预测模型.VMD通过对水位序列进行分解消除噪声,CNN用于有效提取水位数据的局部特征,GRU用于提取水位数据的深层时间特征.以葠窝水库日水位为例,与多个相关模型对比分析,结果表明:精度方面,新模型在选取的评价指标上均表现最佳;运算效率方面,本文选择的GRU与长短时记忆网络(LSTM)相比,运算效率显著提高.新模型预测的高精度、高运算效率更能满足实际水库水位实时调度的需求.
Abstract
The prediction of reservoir water level provides important decision support for reservoir operation,flood control and water resources operation and management.Accurate and reliable prediction plays an important role in the optimal management of water resources.Aiming at the nonlinearity,instability and complex temporal and spatial characteristics of reservoir water level data,a hybrid reservoir water level prediction model integrating adaptive Variational Mode Decomposition (VMD),Convolutional Neural Network (CNN) and Gated Recurrent Unit (GRU) is proposed.Among them,VMD eliminates noise by decomposing the water level sequence,CNN is used to effectively extract the local features of water level data,and GRU is used to extract the deep time features of water level data.Taking the daily water level prediction of Shenwo reservoir as an example,the proposed model outperforms current deep learning models in accuracy.In terms of computing efficiency,the operation efficiency of GRU selected in this approach is significantly improved compared with Long Short-Term Memory network (LSTM).Therefore,the proposed model has high accuracy and high operation efficiency,and is more suitable for the real-time operation of reservoir water level.