en
×

分享给微信好友或者朋友圈

使用微信“扫一扫”功能。
作者简介:

黄后菊,女,硕士生,研究领域为信号与信息处理.2807858629@qq.com

通讯作者:

李波,男,博士,教授,研究领域为智能信息处理.vincy1998@yeah.net

中图分类号:TP391

文献标识码:A

DOI:10.13878/j.cnki.jnuist.20230903002

参考文献 1
杨智勇,叶玉玺,周瑜.基于BiLSTM-SA-TCN时间序列模型在股票预测中的应用[J].南京信息工程大学学报(自然科学版),2023,15(6):643-651.YANG Zhiyong,YE Yuxi,ZHOU Yu.Application of BiLSTM-SA-TCN time series model in stock price prediction[J].Journal of Nanjing University of Information Science & Technology(Natural Science Edition),2023,15(6):643-651
参考文献 2
Sun Y,Sun Q S,Zhu S.Prediction of Shanghai stock index based on investor sentiment and CNN-LSTM model[J].Journal of Systems Science and Information,2022,10(6):620-632
参考文献 3
杨青,王晨蔚.基于深度学习LSTM神经网络的全球股票指数预测研究[J].统计研究,2019,36(3):65-77.YANG Qing,WANG Chenwei.A study on forecast of global stock indices based on deep LSTM neural network[J].Statistical Research,2019,36(3):65-77
参考文献 4
谢游宇,王万雄.基于EMD和SSA的股票预测模型[J].计算机工程与应用,2023,59(18):285-292.XIE Youyu,WANG Wanxiong.Stock forecasting model based on EMD and SSA[J].Computer Engineering and Applications,2023,59(18):285-292
参考文献 5
史建楠,邹俊忠,张见,等.基于DMD-LSTM模型的股票价格时间序列预测研究[J].计算机应用研究,2020,37(3):662-666.SHI Jiannan,ZOU Junzhong,ZHANG Jian,et al.Research of stock price prediction based on DMD-LSTM model[J].Application Research of Computers,2020,37(3):662-666
参考文献 6
苏焕银,彭舒婷,曾琼芳,等.基于VMD-LSTM混合模型的城际高速铁路时变客流预测[J].铁道科学与工程学报,2023,20(4):1200-1210.SU Huanyin,PENG Shuting,ZENG Qiongfang,et al.Forecast of time-dependent passenger flow of intercity high-speed railway based on VMD-LSTM mixed model[J].Journal of Railway Science and Engineering,2023,20(4):1200-1210
参考文献 7
Zhang Y Y,He D,Wu Q Y.Forecasting of PM2.5 concentration time series based on SSA-LSTM model[C]//International Conference on Statistics,Data Science,and Computational Intelligence(CSDSCI 2022).SPIE,2023,12510:373-380
参考文献 8
姜超,李国富.改进VMD-LSTM法在刀具磨损状态识别中的应用[J].机械科学与技术,2022,41(2):246-252.JIANG Chao,LI Guofu.Application of modified VMD and LSTM in tool wear state recognition model[J].Mechanical Science and Technology for Aerospace Engineering,2022,41(2):246-252
参考文献 9
张晨阳,张亚,李培英,等.基于变分模态分解的侵彻过载信号特征提取[J].探测与控制学报,2021,43(3):16-21.ZHANG Chenyang,ZHANG Ya,LI Peiying,et al.Feature extraction of penetration overload signal based on variational mode decomposition[J].Journal of Detection & Control,2021,43(3):16-21
参考文献 10
左亚辉,谢源,邹定江,等.基于混沌麻雀搜索算法的PMSM直接转矩控制[J].组合机床与自动化加工技术,2023(2):174-177.ZUO Yahui,XIE Yuan,ZOU Dingjiang,et al.PMSM direct torque control based on chaotic sparrow search algorithm[J].Modular Machine Tool & Automatic Manufacturing Technique,2023(2):174-177
参考文献 11
柴岩,孙笑笑,任生.融合多向学习的混沌麻雀搜索算法[J].计算机工程与应用,2023,59(6):81-91.CHAI Yan,SUN Xiaoxiao,REN Sheng.Chaotic sparrow search algorithm based on multi-directional learning[J].Computer Engineering and Applications,2023,59(6):81-91
参考文献 12
刘明,宁静.基于SSA-LSTM的重大突发疫情演化预测方法[J].信息与管理研究,2022,7(6):16-29.LIU Ming,NING Jing.Evolutionary prediction method of major epidemic outbreak based on SSA-LSTM[J].Journal of Information and Management,2022,7(6):16-29
参考文献 13
李秀昊,刘怀西,张智勇,等.基于VMD-LSTM的超短期风向多步预测[J].南方能源建设,2023,10(1):29-38.LI Xiuhao,LIU Huaixi,ZHANG Zhiyong,et al.Very short-term wind direction multistep forecast based on VMD-LSTM[J].Southern Energy Construction,2023,10(1):29-38
参考文献 14
Lin M L,Chen C X.Short-term prediction of stock market price based on GA optimization LSTM neurons[C]//Proceedings of the 2018 2nd International Conference on Deep Learning Technologies,2018:66-70
目录contents

    摘要

    针对股票价格非平稳、非线性和高复杂等特性引发的预测难度大的问题,建立一种基于变分模态分解(Variational Mode Decomposition,VMD)-Circle混沌映射的麻雀搜索算法(Circle Sparrow Search Algorithm,CSSA)-长短期记忆 (Long Short-Term Memory,LSTM) 神经网络的组合模型——VMD-CSSA-LSTM.首先,利用VMD将原始股票收盘价数据分解为若干本征模态函数(Intrinsic Mode Function,IMF)分量.然后,采用Circle混沌映射的SSA算法对LSTM神经网络的隐含层神经元、迭代次数、学习率进行优化,将最优参数拟合至LSTM网络中.最后,对每个IMF分量建模预测,将各分量预测结果叠加得到最终结果.实验结果表明,与其他模型相比,本文模型在多支股票数据集上的均方根误差(RMSE)、平均绝对误差(MAE)及平均绝对百分比误差(MAPE)均达到最小,预测股票收盘价格误差在0附近波动,稳定性更优、拟合更佳、精确度更高.

    Abstract

    To address the problems of stock price prediction due to its non-static,highly complex and random fluctuations,a combination model based on Variational Mode Decomposition (VMD)-Circle Sparrow Search Algorithm (CSSA)-Long Short-Term Memory (LSTM) neural network is established.The original stock closing data is decomposed into several Intrinsic Mode Function (IMF) components by VMD,and then the CSSA is used to optimize the parameters of hidden layer neurons,iteration number and learning rate of LSTM,and the optimal parameters are fitted into the LSTM,where each IMF component is modeled and predicted,and the prediction results of IMF component are superimposed to obtain the final result.Experiments show that the RMSE,MAE and MAPE of the proposed model are minimized on multiple stock datasets,the error of the predictied closing prices of individual stocks fluctuates around 0,which is more stable with better fitting and higher accuracy.

  • 0 引言

  • 股票预测是指通过分析股票市场的历史数据预测未来股票价格的变化趋势[1].在处理大规模、高复杂度的股票数据时,传统的统计预测方法难以获得理想的效果.随着信息技术的发展,深度学习凭借更专业的特征学习在股价预测过程中凸显其泛化性与准确性.

  • 作为深度学习中典型的时序预测网络,长短期记忆(Long Short-Term Memory,LSTM)神经网络在股票价格领域较为表现出色,例如:Sun等[2]利用LSTM网络提取数据中的时间特征,对上证指数(000001)进行了预测分析,预测效果优于传统的统计预测法; 杨青等[3]利用深层LSTM网络对30只股票指数不同期限进行了预测研究,实验结果表明LSTM网络的泛化能力较为稳定.在利用LSTM 网络预测股票的基础上,学者们提出了数据分解思想,典型分解有经验模态分解(Empirical Mode Decomposition,EMD)、动态模态分解(Dynamic Mode Decomposition,DMD)和变分模态分解(Variational Mode Decomposition,VMD).谢游宇等[4]构建的EMD与LSTM网络组合模型提高了预测精度,但容易发生模态混叠; 史建楠等[5]利用DMD-LSTM混合模型对鞍钢股份进行了收盘价预测,虽能提取一定量模态信息,但所分解的模态过多,易混淆主辅模态; 苏焕银等[6]构建了VMD-LSTM混合模型用于时变序列预测,证明了较EMD、DMD和单一LSTM网络,VMD-LSTM 能更好地拟合时变数据.此外,为提高预测精度,Zhang等[7]由麻雀搜索算法(Sparrow Search Algorithm,SSA)确定了LSTM模型参数,相比经验论定义参数,SSA-LSTM模型具有更高的预测精度,然而该算法存在初始化随机性的特点,在后期迭代过程中易陷入局部最优.

  • 为了进一步提高预测精度、增强模型稳定性,针对复杂度高与非线性强的股票数据,本文提出一种融合VMD、Circle混沌映射的麻雀搜索算法(Circle Sparrow Search Algorithm,CSSA)与LSTM网络的股票价格预测模型——VMD-CSSA-LSTM.首先,利用VMD对原始股票收盘价序列进行变分模态分解,为将分解损耗约束到最低,使用约束条件确定分解模态数,得到k个表征局部特征的本征模态函数分量(Intrinsic Mode Function,IMF),在确保分解损耗为最低时剔除部分噪声分量,以此泛化非线性股票数据、降低数据复杂度.随后,利用Circle混沌映射初始化SSA算法,使得SSA初始化麻雀分布均匀,避免迭代过程中陷入局部最优,并由该算法对LSTM的隐含层神经元、迭代次数、学习率参数寻优,以提高组合模型的鲁棒性.最后,将最优参数拟合到LSTM网络,对各IMF建模并预测股票收盘价,叠加各 IMF 与其余输入量预测结果得出最终预测值.

  • 1 算法原理

  • 1.1 VMD分解算法

  • 变分模态分解(VMD)是一种新型的时频分析方法,能把多分量信号一次分解为若干个单分量调幅调频信号,规避了迭代过程中的节点效应与虚假分量现象.VMD方法利用构建并求解约束变分问题,将原始信号分解为特定数量的IMF分量,能有效处理非线性、非平稳信号.具体步骤如下:

  • 1)由希尔伯特变换求解出各模态的解析信号且构建频谱,得到每个模态函数在t时刻的解析信号:

  • sk(t)=δ(t)+jπtuk(t)
    (1)
  • 式中:ukt)为第k个本征模态函数分量.

  • 2)对各模态解析信号估算的中心频率进行修正,将模态的频谱移到对应的基带.

  • 3)由解调信号的平方范数估算带宽,约束条件为带宽相加最小,其约束条件如下:

  • minukωk k μtδ(t)+jπtuk(t)e-jωkt222, s.t. k uk(t)=y(t).
    (2)
  • 式中:ωk为第k个模态分量的中心频率[8]; δt)为单位脉冲函数; yt)为初始信号.为将约束变分问题转换为非约束变分问题,本文引入二次惩罚因子μ[9]及拉格朗日乘子λ,此处设λ初值为0,〈,〉为点积,其表达式如下:

  • Luk(t),ωk,λ=μK μtδ(t)+jπtuk(t)e-jωkt22+y(t)-k uk(t)22+λ(t),y(t)-k uk(t)
    (3)
  • 1.2 基于Circle混沌映射的麻雀搜索算法

  • 1.2.1 麻雀搜索算法

  • 麻雀搜索算法(SSA)主要模拟麻雀种群的捕食与反觅食的过程[10].该过程由发现者、加入者和预警者共同参与.发现者在种群中起到搜索和觅食作用,需要较高的适应度,搜索范围广.加入者主要追随发现者,适应度相对较低.预警者在察觉到种群中的捕食者时,对种群发出警告信息,发现者立即将种群迁徙到安全区域.于是,麻雀种群的矩阵表示为

  • X=x11x12x1dx21x22x2dxn1xn2xnd.
    (4)
  • 式中:n为麻雀种群的数量; d为待优化问题变量的维度.

  • SSA种群的适应度函数表示如下:

  • Fx=fx11x12x1dfx21x22x2dfxn1xn2xnd
    (5)
  • 式中:f为每只麻雀的适应度.

  • 发现者的具体位置更新为

  • Xz,jl+1=Xz,jl×exp-zα×imax, R2<TsXz,jl+Q×L, R2Ts.
    (6)
  • 式中:l=1为算法的迭代次数初值; Xz,j 表示第z只麻雀在第j维; L为单位行向量; α为[0,1]间的随机数; imax为最终的迭代次数; Q为标准正态分布随机数; R2为警告值且R2∈[0,1]; Ts为安全值且Ts∈[0.5,1].当R2Ts时,表示在该时刻种群范围内没有危险,发现者继续搜索,使种群有较高适应度; 当R2Ts时,表示预警者察觉到危险信息,释放警告信号,种群向安全区靠近[11].于是,加入者追随发现者觅食过程表示为

  • Xz,jl+1=Q×expXworst l-Xz,jlz2,i>n2;Xql+1+Xz,jl-Xql+1×DTDDT-1×L, .
    (7)
  • 式中:Xworst 为当下时刻种群最差位置; Xq 为当下时刻发现者的最佳位置; D为1×d阶矩阵,其元素为±1的随机值.通常,种群中有10%~20%的麻雀作为预警者提供警告信息,其位置更新情况为

  • Xz,jl+1=Xz,jl+K×Xz,jl-Xworst lgz-gw+ε, gz=gb;Xbest l+β×Xz,jl-Xbest l, gzgb.
    (8)
  • 式中:gz为当前时刻麻雀的适应度; gb为全局最优位置的适应度; gw为全局最差位置适应度; Xbest为当前时刻的全局最优位置; β是方差为1、均值为0的正态分布随机数,β为控制步长的参数; K为[-1,1]间的随机数; ε为接近0的常数.当gzgb时,表示麻雀正处于种群边缘位置容易遭遇危险; 当gz=gb时,表示位于种群中心区域的麻雀收到危险信息,应向其他麻雀靠近以避免被捕食.

  • 1.2.2 基于Circle混沌映射的麻雀搜索算法

  • SSA可随机生成初始化种群,存在种群分布不均现象,致使中后期循环迭代种群多元性快速下降,陷入局部最优解难以跳出的问题.本文在初始化种群时采用Circle混沌映射改进种群分布情况,提升种群个体的多样化.xi为第i′个麻雀的位置,设x1第一个麻雀的位置为随机初始化值,表达式如下:

  • xi'+1=modxi'+0.2-14πsin2πxi',1.
    (9)
  • 原始SSA随机初始化映射与Circle混沌映射对比如图1所示.可以看出,Circle相对原始SSA随机映射种群分布更均匀,提高了个体的随机性.

  • 图1 两种种群初始化对比

  • Fig.1 Comparison of two population initializations

  • 1.3 LSTM网络

  • LSTM是一种改进的循环神经网络,采用LSTM能有效传送和表达较长时间序列中的信息且不会造成较长时间前的有效信息被遗忘.LSTM网络的单元模块结构如图2所示.可以看出,LSTM网络采用记忆细胞记录传递信息.LSTM通过3个控制门来处理时滞任务,并利用sigmoid函数与tanh函数来更新单元状态.3个门分别为遗忘门、输入门、输出门.遗忘门选择上一个阶段的信息多少能留存到现阶段单元状态,输入门选择现阶段输入信息多少能保存在现阶段单元状态,输出门选择现阶段单元状态有多少当作LSTM的输出值.

  • LSTM单元状态计算公式为

  • 图2 LSTM结构

  • Fig.2 LSTM structure

  • im=σWihm-1,xm+bi,
    (10)
  • Cm'=tanhWchm-1,xm+bc,
    (11)
  • Pm=σWphm-1,xm+bp,
    (12)
  • Om=σWohm-1,xm+bo,
    (13)
  • Cm=pmCm-1+imCm',
    (14)
  • hm=OmtanhCm.
    (15)
  • 式中:“⊙”为向量之间的点乘; σ为sigmoid函数,其决定哪些信息将被更新; imPmOm分别为在第m个单元的输入、遗忘、输出门控; xm为第m个单元的输入; hm-1为第m-1个单元的输出; Cm为当前时刻的单元状态; bibcbpbo分别为imCmPmOm的偏置项; WiWcWpWo分别为imCmPmOm的权重项; Cm 为候选细胞信息,函数tanh用于创建新的Cm,定义为

  • tanh(x)=ex-e-xex+e-x
    (16)
  • 2 VMD-CSSA-LSTM组合模型

  • 本文提出的组合模型流程如图3所示,具体步骤表述如下:

  • 1)组合模型共有5个输入量,分别为开盘价、最高价、最低价、成交量、收盘价.一个输出量为收盘价.本文利用VMD仅对输入量收盘价数据进行变分模态分解得到第k个IMF分量.

  • 2)在SSA算法参数寻优前,利用Circle混沌映射初始化种群分布,并划分发现者、跟随者和预警者,设置迭代次数和参数上下边界.

  • 3)为使LSTM网络结构和股票收盘价数据集最优匹配,由SSA算法在LSTM网络训练前对LSTM网络的隐含层神经元个数、迭代次数、学习率寻优.

  • 4)数据集由收盘价、开盘价、最高价、最低价、成交量5个维度构成.若设置LSTM网络步长为n,则使用一个n行5列的矩阵数据对第n+1天的股票收盘价进行预测的计算量较大.于是,在每个分量建模后,应对数据集降维重构.

  • 5)将最优参数输入至LSTM模型,通过划分训练集测试集进行数据归一化.因VMD仅分解了输入量中收盘价数据,利用VMD分解后第k个收盘价数据的IMF分量与其余输入量共同预测收盘价,将k个VMD分解后的收盘价分量与其余输入量共同预测结果叠加得到最终某交易日的收盘价(如设网络步长n为5,将前5个交易日的开盘价、最高价、最低价、成交量与VMD分解后收盘价的第1个IMF分量作为CSSA-LSTM模型输入,进行第6个交易日的收盘价预测,结果记为A1,继续将第2个IMF分量进行第6个交易日的收盘价预测,结果记为A2,直至得到Ak,则第6日的最终预测结果为A1+···+Ak),最后对各交易日收盘价预测数据进行反归一化,输出预测曲线.

  • 3 实验结果与对比分析

  • 3.1 数据来源

  • 本文研究的原始数据集为Tushare财经共享数据集(http://tushare.org/),选取上证指数(000001)为主要实验股,选取2013-02-22至2023-02-13近10年的开盘价、收盘价、最高价、最低价、交易量为原始数据,共获取2 425个上证指数交易日历史数据(不含空数据),将VMD变分模态分解后的数据集作为样本数据集,选取样本数据集的前70%,即2013-02-22至2020-02-13约1 697个交易日的数据作为训练样本集,样本数据集后30%,即2020-02-14至2023-02-13约728个交易日的数据作为测试样本集.本文实验环境为Windows 11、内存16 GB和Matlab R2020b.

  • 3.2 VMD-CSSA-LSTM组合模型股票价格预测方法

  • 3.2.1 VMD变分模态分解

  • 在VMD分解前,需确定所分解的IMF本征模态函数的数目,即确定k值.当k值过大时,邻近模态分量的中心频率较为贴近,会模糊掉部分信号,转换成一部分不需要的噪声分量,影响最终结果.当k值过小时,获得的IMF分量数目少于信号中有效成分数目,由于分解不完整,造成初始信号中某些关键信息被滤除.考虑到在分解过程中会生成无规律且变化幅度较大的残差,需要去除残差.由于去除的残差量会造成部分分解损失,本文针对预测精度与分解损失问题,定义分解损失约束条件并由CSSA优化算法确定k(2≤k≤20)值.设不考虑残差的序列为对应的本征模态函数分量之和:

  • 图3 VMD-CSSA-LSTM组合模型流程

  • Fig.3 Flowchart of the proposed VMD-CSSA-LSTM combination model

  • y(t)=k=220 uk(t).
    (17)
  • 当考虑分解残差量Rt)时,则残差的序列为

  • y'(t)=k=220 uk(t)+R(t).
    (18)
  • 于是,分解损失定义如下:

  • min1T-t=1T- y(t)-y'(t)=min1T-t=1T- R(t).
    (19)
  • 式中: T-为序列的采样点数.可以看出,分解损失由Rt)的平均值决定.为使分解损失达到最小值,此处将分解损失约束条件作为CSSA优化算法的目标函数,迭代次数设为20,寻优k值.

  • 图4通过约束条件确定k值,确保残差分量携带最少的有效信息并将其去除.实验得出,当k=5时且迭代至第17次时,对上证指数(000001)股票收盘价的分解损失接近1.65且达到最低,确定k=5为本实验的IMF分量数目.

  • 图4 寻优k值进化收敛

  • Fig.4 Evolutionary convergence of k-value seeking

  • 在VMD算法中,输入序列为上证指数(000001)股票收盘价.其中:惩罚因子μ=2 500; 噪声容忍度为τ=0,表示允许有误差; 中心频率初始值为1,表示中心频率均匀初始化; 收敛精度为10-6.分解后的5个IMF分量如图5所示,本文将去除空数据后共计2 425个上证指数(000001)交易日历史收盘价数据分解为5个IMF分量,图中截取第1~第1 000个交易日收盘价数据分解后的IMF分量.其中:第1行为原始序列信号; 第2~第6行分别为VMD分解的由低频到高频的IMF1~IMF5分量.可以看出,将上证指数(000001)收盘价数据分解成5个IMF分量,得到5个相对平稳的股票价格子序列.其中:IMF1为频率最低的IMF分量,表示信号的走势或平均值; 其他各分量表示原信号在各频段的波动变化,体现了信号的局部特征及其深层次信息.IMF5体现了局部信号波动率的发展趋势,是最高频率分量.每个IMF分量既保留了原始股票价格信号的特征又避免了模态的混叠效应.

  • 图5 上证指数历史收盘价VMD分解

  • Fig.5 Exploded view of VMD of the historical closing prices of the Shanghai Composite Index

  • 3.2.2 CSSA-LSTM组合模型算法

  • 本文将分解后的5个IMF分量作为样本数据集输入CSSA-LSTM组合模型.为提高模型表达能力,使用激活函数加入非线性因素,该组合模型由输入层、LSTM层、ReLU激活层、输出层构成.为减少经验主观因素对组合模型的影响,使用CSSA算法对隐含层神经元数、迭代次数、学习率3个参数进行寻优.设置LSTM网络步长为5,即以5个交易日的收盘价、开盘价、最高价、最低价、交易量预测第6天的上证指数(000001)收盘价,设置上下边界.

  • 通常,隐含层神经元过少会导致模型欠拟合,过多会导致模型过拟合.当隐含层神经元个数小于30时预测结果欠拟合,而通过下边界从1开始依次乘自然数并代入模型,发现乘到11时的预测结果过拟合,因此确认上边界为300.据观察多次改变隐含层神经元个数对预测结果的分析,隐含层神经元范围在[30,300]间的效果较佳.

  • 在对时间序列进行预测时,并非迭代次数越大,预测精度就越高.随着迭代次数增加,LSTM网络中权重更新次数增加,预测结果会出现过拟合.据文献[12]可知,最大迭代次数在[0,400]间较优.为降低模型时间复杂度,本文通过对比迭代次数为1,10,20,···,100的预测结果拟合情况,确定下边界为30.从400依次减10代入模型观察并预测结果拟合情况,最终确认迭代次数范围为[30,300].

  • 学习率过大学习速度快,但loss容易出现梯度爆炸;学习率过小则收敛速度慢.现有研究常将学习率设为0.1、0.01、0.001和0.0001观察迭代损失情况.本文中将学习率为0.1时,损失值易震荡,学习率为0.0001时,收敛速度过慢,因此将学习率设为[0.001,0.01].

  • CSSA算法对以上3个超参数寻优结果如表1所示.其中,最大迭代次数为20,适应度函数选用均方根误差.考虑到SSA算法中预警者比例需占麻雀总数的10%~20%可确保发现者向安全区移动,本文将预警者的比例设为最大比例0.2.发现者在种群中起到搜索和觅食作用,需较高的种群数,因此将发现者的比例设为0.7,跟随者的比例为0.1,CSSA算法同理.此外,模型训练过程优化器选用Adam算法.

  • 表1 CSSA寻优LSTM网络超参数值

  • Table1 Hyperparameter values of LSTM network by CSSA optimization

  • 在迭代过程中,VMD-CSSA-LSTM组合模型在第2次收敛,均方根误差(Root Mean Square Error,RMSE)为0.051 27,而经对比VMD-SSA-LSTM模型在第4次收敛,RMSE误差为0.056 53,本文VMD-CSSA-LSTM组合模型较VMD-SSA-LSTM模型收敛速度更快,RMSE降低约0.005 3.

  • 接下来,将得到的最优超参数拟合至LSTM网络,对每个分量进行建模.为验证本文对于股票价格预测构建的VMD-CSSA-LSTM组合模型的可靠性和预测精度,对上证指数(000001)历史收盘价数据将VMD变分模态分解后的数据集作为样本数据集,选取该集合的前70%,即2013-02-22至2020-02-13约1 697个交易日数据作为训练样本集,选取该集合的后30%,即2020-02-14至2023-02-13约728个交易日数据作为测试样本集.本实验选取LSTM、VMD-LSTM、VMD-SSA-LSTM与本文组合模型对样本数据集进行预测对比,据文献[13],将LSTM、VMD-LSTM模型隐含层的神经元个数设为100,学习率设为0.001,最优迭代次数设为10,VMD-SSA-LSTM则通过SSA算法进行寻优获得隐含层的神经元个数为272,学习率为0.009 1,最优迭代次数为275,再与本文模型做误差对比和预测结果对比.4种模型真实值与预测值的差值对比如图6所示.可以看出,在对测试集共728条上证指数(000001)股票价格数据进行预测时,单一的LSTM网络对复杂非线性的上证指数(000001)价格预测误差波动在[-300,200]之间,本文模型的预测误差在0附近上下波动,误差较小,稳定性优越.

  • 图6 上证指数收盘价4种模型误差对比

  • Fig.6 Comparison of errors at the closing prices of the Shanghai Composite Index predicted by 4 models

  • 图7显示了上证指数(000001)股票收盘价预测结果.可以看出,上证指数(000001)股票收盘价在2020-02-14至2023-02-13约728个交易日内整体涨跌幅度波动较大,前期价格整体呈上涨阶段,收益趋势总体走强,本文提出的组合模型在整个过程表现最优,VMD-SSA-LSTM表现次之.单一的LSTM网络与目标曲线拟合总体最差,特别是当股票价格涨跌幅波动较大时,本文模型能更为精准地贴合实际股票收盘价格,当股票收盘价涨到最高点时,VMD-CSSA-LSTM组合模型曲线值最为接近目标预测值.在前期上涨阶段买入可获较大回报率,在测试集第450个交易日左右及时卖出,可有效避免严重的经济损失.

  • 图7 上证指数收盘价4种模型预测结果对比

  • Fig.7 Comparison of the closing prices of the Shanghai Composite Index predicted by 4 models

  • 为提高3个模型预测精确度与可信度,采用RMSE、平均绝对误差(Mean Absolute Error,MAE)、平均绝对百分比误差(Mean Absolute Percentage Error,MAPE)3种评价指标对模型进行性能指标评价,训练集性能指标如表2所示,测试集性能指标如表3所示.由表2可以看出:本文模型表现最优,该方法较单一的LSTM网络RMSE降低了126.583 5,MAE降低了85.42,MAPE降低了3.007 4个百分点; 较VMD-LSTM预测方法RMSE降低了108.041 6,MAE降低了65.400 1,MAPE降低了2.399 9个百分点; 较VMD-SSA-LSTM模型RMSE降低了68.866,MAE降低了38.186 8,MAPE降低了1.440 9个百分点.由表3可以看出,在测试集中本文模型同训练集表现最优.由此,在上证指数上的实验表明,在复杂的股票价格预测中本文模型更具优势,可以有效提高股票价格预测精度.

  • 表2 4种模型的训练集预测性能指标

  • Table2 Prediction performance indicators of the 4 models on training set

  • 表3 4种模型的测试集性能指标

  • Table3 Prediction performance indicators of the 4 models on test set

  • 3.2.3 模型复杂度对比分析

  • 本文模型复杂度主要由LSTM网络的时间复杂度和空间复杂度决定.其中,LSTM网络的时间复杂度[14]计算公式如下:

  • OWtime =O4MH2+4MNH.
    (20)
  • 式中:M为输入序列的长度; N为输入特征的维度; H为隐含层神经元数; Wtime为LSTM网络记忆单元计算量; 4MH2为输入门、遗忘门、输出门和候选记忆单元的计算量; 4MNH为输入门、输出门和记忆单元的计算量.在降维重构后,存在M=1和N=2 425.VMD算法仅分解收盘价序列,在VMD算法将收盘价序列分解为5个分量后,将其维度由重构后的M值1变为5,因此,其时间复杂度仅改变公式中的M值.由3.2.2节可知,在LSTM与VMD-LSTM模型中,H值为100.SSA或CSSA算法在模型中起到参数寻优作用,其仅改变公式中的隐含层神经元个数H值.因此,在VMD-SSA-LSTM与VMD-CSSA-LSTM模型中,H值为SSA或CSSA算法寻优后获得,分别为272和260.

  • 空间复杂度可描述算法所占内存空间,本文将其视为模型参数数量.因模型过万量级的参数量,本文计算空间复杂度时将VMD、SSA和CSSA自带个位数量级的参数忽略不计,LSTM网络的空间复杂度计算公式如下:

  • OWspace =O4HN+4H2+4H.
    (21)
  • 由表4可以看出,本文模型时间复杂度和空间复杂度均低于VMD-SSA-LSTM模型,高于LSTM和VMD-LSTM模型.由于LSTM网络本身的高复杂性和本文模型更高的预测精度,其时间复杂度和空间复杂度在可接受范围内.

  • 表4 4种模型的复杂度对比

  • Table4 Complexity comparison between the 4 models

  • 3.2.4 模型有效性验证

  • 为验证本模型的有效性和鲁棒性,本文另选取比亚迪(002594)、工商银行(IDCBY)和贵州茅台(600519)3只个股进行验证.实验环境、数据来源与模型同上证指数,选取2013-02-22至2023-02-13近10年的开盘价、收盘价、最高价、最低价、交易量为原始数据,划分前70%为训练集,后30%为验证集.当k=5时,由于工商银行(IDCBY)为美股,与另外2只个股略有差别,其分解损失约0.007美元.比亚迪(002594)分解损失约0.153元,贵州茅台(600519)分解损失约1.092元.由于美股节假日开盘情况与中国略微差别,因此工商银行(IDCBY)验证集为755个交易日数据.图8显示了这3只个股收盘价预测结果,红色曲线为本文模型,黑色曲线为实际目标数据,蓝色曲线为VMD-SSA-LSTM模型.可以看出,本文模型最为靠近真实目标曲线,VMD-SSA-LSTM模型稍次之,VMD-LSTM模型和LSTM网络虽与实际目标数据走势大致相同,但与实际目标数据拟合较差.本文模型较其他3个模型更为平稳,能反映股票的整体收盘价走势,且能在估计细微变化时取得较好的预测效果.

  • 4 结语

  • 为提高股票价格预测的稳定性和精确度,本文融合了VMD算法,引入Circle混沌映射的SSA算法和LSTM网络模型,提出一种组合模型——VMD-CSSA-LSTM.经过对上证指数(000001)收盘价预测的分析,得出如下结论:

  • 1)VMD算法将股票价格时间序列分解成多个平稳的IMF分量,降低了数据复杂度,减少了部分测试误差噪声干扰,提高了预测精度.

  • 2)在SSA算法引入Circle混沌映射初始化种群分布,提高了迭代收敛速度并降低了迭代误差.选择CSSA算法进行LSTM网络隐含层参数优化,提高了预测的稳定性和鲁棒性.

  • 由于股票收盘价格预测在一定程度上受投资者主观因素影响,本文模型还有改进的空间.下一步拟将投资者情绪引入到本文模型以取得更好的预测结果.此外,本文模型侧重于预测精度的提高,其时间复杂度和空间复杂度难以兼顾到最低.因此,对本文模型时间复杂度和空间复杂度的优化还有待深入研究.

  • 图8 3只个股收盘价4种模型预测结果对比

  • Fig.8 Comparison of closing prices of 3 stocks predicted by the 4 models

  • 参考文献

    • [1] 杨智勇,叶玉玺,周瑜.基于BiLSTM-SA-TCN时间序列模型在股票预测中的应用[J].南京信息工程大学学报(自然科学版),2023,15(6):643-651.YANG Zhiyong,YE Yuxi,ZHOU Yu.Application of BiLSTM-SA-TCN time series model in stock price prediction[J].Journal of Nanjing University of Information Science & Technology(Natural Science Edition),2023,15(6):643-651

    • [2] Sun Y,Sun Q S,Zhu S.Prediction of Shanghai stock index based on investor sentiment and CNN-LSTM model[J].Journal of Systems Science and Information,2022,10(6):620-632

    • [3] 杨青,王晨蔚.基于深度学习LSTM神经网络的全球股票指数预测研究[J].统计研究,2019,36(3):65-77.YANG Qing,WANG Chenwei.A study on forecast of global stock indices based on deep LSTM neural network[J].Statistical Research,2019,36(3):65-77

    • [4] 谢游宇,王万雄.基于EMD和SSA的股票预测模型[J].计算机工程与应用,2023,59(18):285-292.XIE Youyu,WANG Wanxiong.Stock forecasting model based on EMD and SSA[J].Computer Engineering and Applications,2023,59(18):285-292

    • [5] 史建楠,邹俊忠,张见,等.基于DMD-LSTM模型的股票价格时间序列预测研究[J].计算机应用研究,2020,37(3):662-666.SHI Jiannan,ZOU Junzhong,ZHANG Jian,et al.Research of stock price prediction based on DMD-LSTM model[J].Application Research of Computers,2020,37(3):662-666

    • [6] 苏焕银,彭舒婷,曾琼芳,等.基于VMD-LSTM混合模型的城际高速铁路时变客流预测[J].铁道科学与工程学报,2023,20(4):1200-1210.SU Huanyin,PENG Shuting,ZENG Qiongfang,et al.Forecast of time-dependent passenger flow of intercity high-speed railway based on VMD-LSTM mixed model[J].Journal of Railway Science and Engineering,2023,20(4):1200-1210

    • [7] Zhang Y Y,He D,Wu Q Y.Forecasting of PM2.5 concentration time series based on SSA-LSTM model[C]//International Conference on Statistics,Data Science,and Computational Intelligence(CSDSCI 2022).SPIE,2023,12510:373-380

    • [8] 姜超,李国富.改进VMD-LSTM法在刀具磨损状态识别中的应用[J].机械科学与技术,2022,41(2):246-252.JIANG Chao,LI Guofu.Application of modified VMD and LSTM in tool wear state recognition model[J].Mechanical Science and Technology for Aerospace Engineering,2022,41(2):246-252

    • [9] 张晨阳,张亚,李培英,等.基于变分模态分解的侵彻过载信号特征提取[J].探测与控制学报,2021,43(3):16-21.ZHANG Chenyang,ZHANG Ya,LI Peiying,et al.Feature extraction of penetration overload signal based on variational mode decomposition[J].Journal of Detection & Control,2021,43(3):16-21

    • [10] 左亚辉,谢源,邹定江,等.基于混沌麻雀搜索算法的PMSM直接转矩控制[J].组合机床与自动化加工技术,2023(2):174-177.ZUO Yahui,XIE Yuan,ZOU Dingjiang,et al.PMSM direct torque control based on chaotic sparrow search algorithm[J].Modular Machine Tool & Automatic Manufacturing Technique,2023(2):174-177

    • [11] 柴岩,孙笑笑,任生.融合多向学习的混沌麻雀搜索算法[J].计算机工程与应用,2023,59(6):81-91.CHAI Yan,SUN Xiaoxiao,REN Sheng.Chaotic sparrow search algorithm based on multi-directional learning[J].Computer Engineering and Applications,2023,59(6):81-91

    • [12] 刘明,宁静.基于SSA-LSTM的重大突发疫情演化预测方法[J].信息与管理研究,2022,7(6):16-29.LIU Ming,NING Jing.Evolutionary prediction method of major epidemic outbreak based on SSA-LSTM[J].Journal of Information and Management,2022,7(6):16-29

    • [13] 李秀昊,刘怀西,张智勇,等.基于VMD-LSTM的超短期风向多步预测[J].南方能源建设,2023,10(1):29-38.LI Xiuhao,LIU Huaixi,ZHANG Zhiyong,et al.Very short-term wind direction multistep forecast based on VMD-LSTM[J].Southern Energy Construction,2023,10(1):29-38

    • [14] Lin M L,Chen C X.Short-term prediction of stock market price based on GA optimization LSTM neurons[C]//Proceedings of the 2018 2nd International Conference on Deep Learning Technologies,2018:66-70

  • 参考文献

    • [1] 杨智勇,叶玉玺,周瑜.基于BiLSTM-SA-TCN时间序列模型在股票预测中的应用[J].南京信息工程大学学报(自然科学版),2023,15(6):643-651.YANG Zhiyong,YE Yuxi,ZHOU Yu.Application of BiLSTM-SA-TCN time series model in stock price prediction[J].Journal of Nanjing University of Information Science & Technology(Natural Science Edition),2023,15(6):643-651

    • [2] Sun Y,Sun Q S,Zhu S.Prediction of Shanghai stock index based on investor sentiment and CNN-LSTM model[J].Journal of Systems Science and Information,2022,10(6):620-632

    • [3] 杨青,王晨蔚.基于深度学习LSTM神经网络的全球股票指数预测研究[J].统计研究,2019,36(3):65-77.YANG Qing,WANG Chenwei.A study on forecast of global stock indices based on deep LSTM neural network[J].Statistical Research,2019,36(3):65-77

    • [4] 谢游宇,王万雄.基于EMD和SSA的股票预测模型[J].计算机工程与应用,2023,59(18):285-292.XIE Youyu,WANG Wanxiong.Stock forecasting model based on EMD and SSA[J].Computer Engineering and Applications,2023,59(18):285-292

    • [5] 史建楠,邹俊忠,张见,等.基于DMD-LSTM模型的股票价格时间序列预测研究[J].计算机应用研究,2020,37(3):662-666.SHI Jiannan,ZOU Junzhong,ZHANG Jian,et al.Research of stock price prediction based on DMD-LSTM model[J].Application Research of Computers,2020,37(3):662-666

    • [6] 苏焕银,彭舒婷,曾琼芳,等.基于VMD-LSTM混合模型的城际高速铁路时变客流预测[J].铁道科学与工程学报,2023,20(4):1200-1210.SU Huanyin,PENG Shuting,ZENG Qiongfang,et al.Forecast of time-dependent passenger flow of intercity high-speed railway based on VMD-LSTM mixed model[J].Journal of Railway Science and Engineering,2023,20(4):1200-1210

    • [7] Zhang Y Y,He D,Wu Q Y.Forecasting of PM2.5 concentration time series based on SSA-LSTM model[C]//International Conference on Statistics,Data Science,and Computational Intelligence(CSDSCI 2022).SPIE,2023,12510:373-380

    • [8] 姜超,李国富.改进VMD-LSTM法在刀具磨损状态识别中的应用[J].机械科学与技术,2022,41(2):246-252.JIANG Chao,LI Guofu.Application of modified VMD and LSTM in tool wear state recognition model[J].Mechanical Science and Technology for Aerospace Engineering,2022,41(2):246-252

    • [9] 张晨阳,张亚,李培英,等.基于变分模态分解的侵彻过载信号特征提取[J].探测与控制学报,2021,43(3):16-21.ZHANG Chenyang,ZHANG Ya,LI Peiying,et al.Feature extraction of penetration overload signal based on variational mode decomposition[J].Journal of Detection & Control,2021,43(3):16-21

    • [10] 左亚辉,谢源,邹定江,等.基于混沌麻雀搜索算法的PMSM直接转矩控制[J].组合机床与自动化加工技术,2023(2):174-177.ZUO Yahui,XIE Yuan,ZOU Dingjiang,et al.PMSM direct torque control based on chaotic sparrow search algorithm[J].Modular Machine Tool & Automatic Manufacturing Technique,2023(2):174-177

    • [11] 柴岩,孙笑笑,任生.融合多向学习的混沌麻雀搜索算法[J].计算机工程与应用,2023,59(6):81-91.CHAI Yan,SUN Xiaoxiao,REN Sheng.Chaotic sparrow search algorithm based on multi-directional learning[J].Computer Engineering and Applications,2023,59(6):81-91

    • [12] 刘明,宁静.基于SSA-LSTM的重大突发疫情演化预测方法[J].信息与管理研究,2022,7(6):16-29.LIU Ming,NING Jing.Evolutionary prediction method of major epidemic outbreak based on SSA-LSTM[J].Journal of Information and Management,2022,7(6):16-29

    • [13] 李秀昊,刘怀西,张智勇,等.基于VMD-LSTM的超短期风向多步预测[J].南方能源建设,2023,10(1):29-38.LI Xiuhao,LIU Huaixi,ZHANG Zhiyong,et al.Very short-term wind direction multistep forecast based on VMD-LSTM[J].Southern Energy Construction,2023,10(1):29-38

    • [14] Lin M L,Chen C X.Short-term prediction of stock market price based on GA optimization LSTM neurons[C]//Proceedings of the 2018 2nd International Conference on Deep Learning Technologies,2018:66-70

  • 地址:江苏省南京市宁六路219号    邮编:210044

    联系电话:025-58731025    E-mail:nxdxb@nuist.edu.cn

    南京信息工程大学学报 ® 2024 版权所有  技术支持:北京勤云科技发展有限公司