en
×

分享给微信好友或者朋友圈

使用微信“扫一扫”功能。
作者简介:

路凯丽,女,硕士生,研究方向为大数据分析与应用.lu200008@126.com;

杨露,女,博士,副教授,研究方向为大数据分析与应用.yanglu20497@163.com

通讯作者:

杨露,女,博士,副教授,研究方向为大数据分析与应用.yanglu20497@163.com

中图分类号:TP183

文献标识码:A

DOI:10.13878/j.cnki.jnuist.20230421001

参考文献 1
秦耀辰,谢志祥,李阳.大气污染对居民健康影响研究进展[J].环境科学,2019,40(3):1512-1520.QIN Yaochen,XIE Zhixiang,LI Yang.Review of research on the impacts of atmospheric pollution on the health of residents[J].Environmental Science,2019,40(3):1512-1520
参考文献 2
牟敬锋,赵星,樊静洁,等.基于ARIMA模型的深圳市空气质量指数时间序列预测研究[J].环境卫生学杂志,2017,7(2):102-107,117.MOU Jingfeng,ZHAO Xing,FAN Jingjie,et al.Time series prediction of AQI in Shenzhen based on ARIMA model[J].Journal of Environmental Hygiene,2017,7(2):102-107,117
参考文献 3
杨思琪,赵丽华.随机森林算法在城市空气质量预测中的应用[J].统计与决策,2017(20):83-86.YANG Siqi,ZHAO Lihua.Application of random forest algorithm in urban air quality prediction[J].Statistics & Decision,2017(20):83-86
参考文献 4
焦东方,孙志华.空气质量指数回归分析[J].中国海洋大学学报(自然科学版),2018,48(增刊2):228-234.JIAO Dongfang,SUN Zhihua.Regression analysis of air quality index[J].Periodical of Ocean University of China,2018,48(sup2):228-234
参考文献 5
Shishegaran A,Saeedi M,Kumar A,et al.Prediction of air quality in Tehran by developing the nonlinear ensemble model[J].Journal of Cleaner Production,2020,259:120825
参考文献 6
Phruksahiran N.Improvement of air quality index prediction using geographically weighted predictor methodology[J].Urban Climate,2021,38:100890
参考文献 7
胡青,龚世才,胡珍.基于改进麻雀搜索算法的空气质量指数预测[J].广西科学,2022,29(4):642-651.HU Qing,GONG Shicai,HU Zhen.Air quality index prediction based on improved sparrow search algorithm[J].Guangxi Sciences,2022,29(4):642-651
参考文献 8
孙启森,张建新,程海阳,等.基于注意力的卷积神经网络金融时序数据预测[J].计算机应用,2022,42(增刊2):290-295.SUN Qisen,ZHANG Jianxin,CHENG Haiyang,et al.Financial time series data prediction by attention-based convolutional neural network[J].Journal of Computer Applications,2022,42(sup2):290-295
参考文献 9
袁培森,黎薇,任守纲,等.基于卷积神经网络的菊花花型和品种识别[J].农业工程学报,2018,34(5):152-158.YUAN Peisen,LI Wei,REN Shougang,et al.Recognition for flower type and variety of chrysanthemum with convolutional neural network[J].Transactions of the Chinese Society of Agricultural Engineering,2018,34(5):152-158
参考文献 10
Shujaat M,Wahab A,Tayara H,et al.pcPromoter-CNN:a CNN-based prediction and classification of promoters[J].Genes,2020,11(12):1529
参考文献 11
周飞燕,金林鹏,董军.卷积神经网络研究综述[J].计算机学报,2017,40(6):1229-1251.ZHOU Feiyan,JIN Linpeng,DONG Jun.Review of convolutional neural network[J].Chinese Journal of Computers,2017,40(6):1229-1251
参考文献 12
杨丽,吴雨茜,王俊丽,等.循环神经网络研究综述[J].计算机应用,2018,38(S2):1-6,26.YANG Li,WU Yuxi,WANG Junli,et al.Research on recurrent neural network[J].Journal of Computer Applications,2018,38(S2):1-6,26
参考文献 13
Liu P H,Liu J,Wu K.CNN-FCM:system modeling promotes stability of deep learning in time series prediction[J].Knowledge-Based Systems,2020,203:106081
参考文献 14
罗建豪,吴建鑫.基于深度卷积特征的细粒度图像分类研究综述[J].自动化学报,2017,43(8):1306-1318.LUO Jianhao,WU Jianxin.A survey on fine-grained image categorization using deep convolutional features[J].Acta Automatica Sinica,2017,43(8):1306-1318
参考文献 15
王艳平,韩晓冰.基于CNN的主动悬架传感器故障诊断[ J/OL]. 控制工程:1⁃6 [ 2022⁃11⁃22]. https://kns. cnki.net/kcms2/article/abstract?v = 3uoqIhG8C45S0n⁃ 9fL2suRadTyEVl2pW9UrhTDCdPD64wIMnTVGX3TlB⁃ 19tACLaj6qrspFdwKw3wbBCaM13H3OmPugJRq6N6D⁃ &uniplatform=NZKPT.WANG Yanping,HAN Xiaobing. CNN⁃based active sus⁃ pension sensor fault diagnosis [ J/OL ]. Control Engineering:1⁃6[2022⁃11⁃22].https://kns.cnki.net/kc⁃ ms2/article/abstract?v = 3uoqIhG8C45S0n9fL2suRad⁃ TyEVl2pW9UrhTDCdPD64wIMnTVGX3TlB19tACLaj6⁃ qrspFdwKw3wbBCaM13H3OmPugJRq6N6D&unipl⁃ atform=NZKPT
参考文献 16
蔡薇薇,徐彦伟,颉潭成.基于CNN-LSTM的轴承剩余使用寿命预测[J].机械传动,2022,46(10):17-23.CAI Weiwei,XU Yanwei,XIE Tancheng.Prediction of bearing remaining service life based on CNN-LSTM[J].Journal of Mechanical Transmission,2022,46(10):17-23
参考文献 17
Cho K,van Merrienboer B,Gulcehre C,et al.Learning phrase representations using RNN encoder-decoder for statistical machine translation[J].arXiv e-print,2014,arXiv:1406.1078
参考文献 18
Hochreiter S,Schmidhuber J.Long short-term memory[J].Neural Computation,1997,9(8):1735-1780
参考文献 19
彭豪杰,周杨,胡校飞,等.基于深度学习与随机森林的PM2.5浓度预测模型[J].遥感学报,2023,27(2):430-440.PENG Haojie,ZHOU Yang,HU Xiaofei,et al.A PM2.5 prediction model based on deep learning and random forest[J].Journal of Remote Sensing,2023,27(2):430-440
目录contents

    摘要

    大气污染严重危害居民的出行安全和身体健康,空气质量指数(AQI)是一种用于测量空气质量状况的综合指标,对AQI的预测可以提醒公众空气质量信息,使人们做出更明智的出行决策.通过提前预测空气质量的变化,政府和环保部门可以采取应急措施以减轻空气污染.本文提出基于卷积神经网络和门控循环单元的集成深度学习模型(CNN-GRU)对AQI进行预测.其中,卷积神经网络(CNN)提取污染气体浓度和AQI的时空特征并完成特征映射,门控循环单元(GRU)建模时序关系并高效完成计算.选取2014—2022年北京市和广州市的6种主要污染气体(PM2.5、PM10、SO2、CO、NO2、O3)日平均质量浓度和AQI进行实例研究,使用CNN-GRU模型对AQI进行预测,与多元宇宙优化的广义回归神经网络模型(MVO-GRNN)、遗传算法优化的BP神经网络模型(GA-BP)对AQI的预测进行对比分析.实验结果表明,本文提出的CNN-GRU模型对AQI的预测误差最小.

    Abstract

    Air pollution seriously endangers the travel safety and health of residents.As a comprehensive indicator used to measure air quality condition,Air Quality Index (AQI) can alert the public to air quality and enable people to make more informed travel decisions.By predicting the change of air quality in advance,the government and environmental protection departments can take emergency measures to reduce air pollution.Here,we propose an integrated deep learning model based on Convolutional Neural Network and Gated Recurrent Unit (CNN-GRU) for AQI prediction.The CNN is used to extract the spatial and temporal characteristics of air pollutants and AQI and complete the feature mapping,while the GRU to model the temporal relationship and complete the calculation and AQI efficiently.The daily average concentrations of six major air pollutants (PM2.5,PM10,SO2,CO,NO2,O3) in Beijing and Guangzhou during 2014-2022 are selected for example study,and the AQI is predicted using the CNN-GRU model.The results show that,compared with Multiverse-Optimized Generalized Regression Neural Network model (MVO-GRNN) and Genetic Algorithm-optimized BP neural network model (GA-BP),the proposed CNN-GRU model has the smallest prediction error for AQI.

  • 0 引言

  • 大气污染对国家可持续发展和居民健康带来不利影响.大气污染物浓度增加会显著提升呼吸系统疾病、心血管疾病和肺癌等的发病率和死亡率[1],威胁人们的出行安全和身体健康.除此之外,大气污染物抑制农作物生长,阻碍铁路交通发展,危害巨大.《环境空气质量指数(AQI)技术规定(试行)》(HJ 633—2012)将空气质量指数共分为6级,对应优、良、轻度污染、中度污染、重度污染和严重污染6种空气质量,每种空气质量状况对健康影响不同,分别具有相应的建议和措施以保护公众健康.一般来说,较低的AQI值表示较好的空气质量,较高的AQI值表示较差的空气质量.对AQI进行预测可以帮助人们提前了解大气污染情况,采取相应的健康防护措施.同时,对AQI进行预测可以提前警示大气污染的发生,有助于政府相关管理部门有针对性地制定应急措施和环保措施,例如交通管制、限制工业排放、停工停产等.对AQI的预测还可以用于评估和监控大气污染治理措施的效果,并指导进一步的环境管理和决策制定.

  • 目前,许多学者利用传统的统计方法[2]和机器学习算法[3]对AQI进行预测.焦东方等[4]利用多元回归分析法建立了AQI与PM2.5、PM10、SO2、O3质量浓度的回归模型,对青岛市每日空气质量指数进行预测.Shishegaran等[5]构建了差分整合移动平均自回归模型(Autoregressive Integrated Moving Average,ARIMA)、主成分回归模型(Principle Component Regression,PCR)、ARIMA-PCR组合模型、ARIMA和基因表达编程(GEP)的组合模型对每日空气质量指数进行预测,并使用平均绝对百分比误差(MAPE)、均方根误差(RMSE)和归一化均方误差(NMSE)等指标来评估和比较模型预测效果.Phruksahiran[6]提出一种将机器学习算法和地理加权预测因子方法(GWP)结合的集成预测方法,包括RF-GWP方法、XG-GWP方法、NN-GWP方法,分别对城市空气质量指数进行预测.但是传统的统计方法无法准确捕捉空气质量中复杂的非线性关系和时序模式,易受异常值和噪声的影响,传统机器学习算法无法自动学习时序特征表示,对特征工程存在依赖性.

  • 卷积神经网络(Convolutional Neural Networks,CNN)可以有效克服上述缺陷.CNN作为深度学习的代表性神经网络模型,可以很好地完成非线性拟合[7]并自动提取特征.孙启森等[8]采用引入注意力机制的卷积神经网络模型对金融时间序列数据进行预测.袁培森等[9]利用神经网络技术对菊花的原始图像进行逐层特征学习,从而实现对该类农产品花型和品种的高效识别.Shujaat等[10]构建了基于CNN的pcPromoter-CNN工具对DNA结构中的启动子进行分类和预测.虽然CNN具有自动提取特征和权值共享的优势[11],但是其训练过程通常需要较大的计算资源和时间,而门控循环单元(Gated Recurrent Unit,GRU)作为循环神经网络模型(Recurrent Neural Networks,RNN)的变体[12],只使用两个门控开关,具有模型的简单性和计算的高效性.因此,本文构建CNN-GRU集成深度学习模型,在处理城市空气质量时间序列数据时可以同时进行特征提取和序列建模,避免了梯度消失和梯度爆炸问题,在小模型参数下有更好的表现能力,对AQI的预测效果更好.

  • 1 基本原理

  • 1.1 卷积神经网络

  • CNN是在视觉系统结构的启示下开发的一种具有深度结构和卷积运算的前馈神经网络,是深度学习的代表算法之一,擅长非线性数据的特征提取,广泛应用于时序预测[13]、图像分类[14]、故障诊断[15]等方面.CNN包括输入层、卷积层、池化层、Flatten层、全连接层和输出层.

  • 输入层是CNN的起始层,负责接收、预处理原始输入数据和网络配置.输入数据可以是图片数据、文本数据、表格数据、传感器数据或语音信号数据,输入层接收数据后对其进行预处理,如图像归一化、对语音进行傅里叶变换等.同时,输入层设置输入数据的尺寸、通道数和类型等配置参数,为卷积层提供合适的输入数据.

  • 卷积层是CNN的核心层,主要负责特征提取,具有局部连接、参数共享和尺度不变性的特性.卷积层通过卷积核对每个通道的矩阵依次运算来提取输入数据中有用的特征表示,为池化层提供更丰富抽象的输入数据.卷积层采用局部连接方式,可以捕捉输入数据的局部特征.卷积层中的卷积核在输入数据上共享参数,极大地减少CNN的参数量,提高了CNN的计算效率.卷积操作[16]的数学表示为

  • hn=fiM winxin-1+bn,
    (1)
  • 式中:hn为第n层输出; M为输入特征矢量; win 为第n层卷积核; xin-1为第n层输入; bn 为第n层偏置参数.

  • 池化层是CNN中的常用层,负责尺寸缩减、特征保留和特征降维,具有平移不变性.池化层对输入特征映射进行下采样,减小特征映射的尺寸,有利于降低CNN计算复杂度,防止过拟合.池化层对局部区域特征进行聚合,通过最大值池化或平均值池化保留输入特征映射中的主要特征信息,降低了特征映射的维度.

  • Flatten层在CNN中位于池化层和全连接层之间,主要用于将池化层输出的多维数据转换为1维向量,以便输入到全连接层进行分类或回归等任务.

  • 全连接层主要负责特征融合、参数学习和非线性关系学习,层中使用激活函数引入非线性关系,增加CNN的表达能力.全连接层包含的可训练的权重和偏置参数在训练过程进行优化,使CNN具有最优的特征表示.全连接层将高级特征表示转换为最终的分类或回归结果并传入到输出层,输出层负责产生CNN的最终预测结果.

  • 1.2 门控循环单元

  • GRU是循环神经网络的变体,用于处理序列数据.GRU[17]具有门控机制,由更新门和重置门两个门类组成,可以有效地解决传统RNN中的长期依赖和梯度爆炸问题.GRU相比RNN的另一个代表变体长短期记忆递归神经网络(LSTM)[18]结构更简便,计算速度和更新速度更快,其结构原理如图1所示.

  • 图1 GRU结构原理

  • Fig.1 Schematic of GRU structure

  • 更新门控制当前时间步的输入是否更新到隐藏状态,让模型自动决定当前时间步的输入对于更新隐藏状态的重要性,从而可以选择性地更新或保留之前的隐藏状态.重置门控制之前隐藏状态和当前输入之间的信息传递,让模型自动决定是否将之前隐藏状态中的信息重置,从而可以选择性地遗忘或保留之前的信息.GRU通过引入更新门和重置门,可以灵活地控制对输入和隐藏状态的信息更新和遗忘,从而更好地捕捉长期依赖关系.其数学模型如下:

  • zt=σWxzxt+Whzht-1
    (2)
  • rt=σWxrxt+Whrht-1,
    (3)
  • gt=tanhWxhxt+rt*Whhht-1,
    (4)
  • ht=zt*ht-1+1-zt*gt,
    (5)
  • 式中:z为更新门,r为重置门,g为重置信息,h为隐藏层,W为权重,x为输入信息,t为时刻,*表示线性变换.

  • 1.3 CNN-GRU模型预测流程

  • CNN-GRU集成深度学习模型对AQI的预测流程包括空气质量数据的输入、CNN网络的特征提取、GRU网络的时序计算和AQI预测值的输出,预测流程如图2所示.

  • CNN-GRU集成深度学习模型对AQI的预测步骤如下:

  • 1)空气质量数据的输入

  • 输入数据为城市每日的PM2.5、PM10、SO2、NO2、CO、O3质量浓度值和AQI值.由于收集的数据中存在缺失和各指标量纲不同的问题,本文使用插值函数处理缺失值,并对变量进行归一化处理.然后,对数据集划分训练集和测试集后进入CNN网络.

  • 2)CNN网络的特征提取

  • 在AQI预测中,CNN通过卷积操作和非线性激活函数,学习输入数据不同层次的抽象特征表示,从城市空气质量时间序列数据中提取有用的空间模式和局部特征.AQI数据具有空间分布特征,CNN可以有效地捕捉空间上的相关性.通过使用卷积层和池化层,CNN可以识别局部的模式和结构,并对其进行下采样,从而减少参数数量并保留重要的空间信息.城市空气质量数据的空间维度通过池化层后降低,减少了模型的复杂度和计算量,有利于处理大规模空气质量数据并减轻过拟合风险.CNN通过共享权重的方式,将学到的特征在整个数据集传递,在不同时间步上共享相同的特征提取器,使得模型能够学习到数据的通用特征,并更好地泛化到新的样本上.

  • 3)GRU网络的时序计算

  • GRU通过记忆单元和更新门控制信息的传递和遗忘,使得网络能够有效地处理时间上的相关性.在AQI预测任务中,GRU网络可以利用过去时间步的信息来预测未来时间步的AQI值,并且能够自适应地学习序列中的模式和趋势.

  • 4)AQI预测值的输出

  • 在CNN-GRU模型预测AQI的过程中,输出层将前面层级中提取到的特征映射到最终的预测结果,得到最终的AQI预测值.

  • 2 模型设计

  • 2.1 实验环境

  • 本文的实验环境为Windows10 64位操作系统,使用Anaconda的Jupyter Notebook进行编程,Python解释器版本为3.9.12,使用TensorFlow和Keras搭建神经网络模型,编程语言为Python,同时使用MATLAB构建对照模型.

  • 图2 CNN-GRU集成模型预测流程

  • Fig.2 Processes of AQI prediction by CNN-GRU integrated model

  • 2.2 参数设置

  • CNN-GRU模型由输入层、CNN网络、GRU网络和输出层组成.输入层设置输入数据的数据类型为32位浮点数、数据尺寸为6×6.采用移动窗口进行平滑训练和预测.CNN网络设置两层卷积、两层池化、一个Flatten层和一个全连接层,参数设置如表1所示.第一卷积层中的卷积核尺寸为2×2,通道数为1,包含32个卷积核,使用ReLU激活函数.第二卷积层中的卷积核尺寸为2×2,通道为1,包含64个卷积核,同样使用ReLU激活函数.两层池化均采用最大池化函数进行池化操作.位于池化层和全连接层之间的Flatten层将多维输入数据展平为1维向量.然后连接隐层节点为512的全连接层,并设置Dropout,防止模型过拟合.CNN网络中损失函数采用交叉熵,优化器采用Adam优化算法.

  • 表1 CNN模型参数

  • Table1 CNN model parameters

  • 本文使用Keras神经网络框架创建GRU网络,使用序贯Sequential模型对象依次添加3个GRU层和一个全连接层.其中GRU层分别为:一个带有64个单元、采用ReLU激活函数以及设置return_sequences=True的GRU层,一个带有32个单元、采用ReLU激活函数以及设置return_sequences=True的GRU层,一个带有32个单元、采用ReLU激活函数以及设置return_sequences=False的GRU层.设定return_sequences参数为Ture,表示将该层结果作为下一层的输入.全连接层将GRU单元的输出映射成一个单一的输出值,即经过模型计算的AQI值.损失函数使用均方误差(Mean Squared Error,MSE),优化器选用Adam,通过model.compile()函数的调用,将损失函数和优化器配置到模型中,使得模型在训练过程中能够使用这些设置进行参数的更新和优化.调用summary()函数输出GRU模型各层的参数状况,Param数值如表2所示.模型设置权重变量和偏置变量,将多维向量转化为1维,输出最终AQI预测结果.

  • 表2 GRU参数

  • Table2 GRU parameters

  • 2.3 评价指标

  • 本文采用平均绝对误差(MAE)、均方根误差(RMSE)、平均绝对百分比误差(MAPE)作为各模型预测AQI效果的评价指标,表达式如下:

  • eMAE=1ni=1n y^i-yi,
    (6)
  • eRMSE=1ni=1n y^i-yi2,
    (7)
  • eMAPE=100%ni=1n y^i-yiyi,
    (8)
  • 式中,yi为AQI真实值,y^i为AQI预测值,n为样本个数.

  • 2.4 超参数调优

  • 当使用深度学习模型完成分类或回归任务时,存在一些超参数,它们控制模型的行为和性能且需要手动设置.超参数调优是通过尝试不同的超参数值来获取最佳超参数配置,优化模型的性能.本文对学习率、Epoch 大小、batch_size、dropout率和步长进行超参数训练寻优,使用MAE、RMSE、MAPE 3个指标进行模型预测性能评估,从中选择CNN-GRU集成深度学习模型预测AQI最佳的超参数配置.

  • 1)学习率

  • 学习率(Learning Rate)用于控制深度学习模型在训练过程中更新参数的幅度.Learning Rate的大小对于CNN-GRU模型的训练过程和性能起着重要的作用.Learning Rate过大会导致模型在参数空间中跳过最优解,Learning Rate过小会导致模型收敛速度慢,模型训练的时间成本高.本文分别对0.1、0.01、0.001和0.000 1的学习率进行测试,CNN-GRU模型在不同学习率下损失函数的曲线如图3所示.

  • 图3中橙色曲线代表训练集损失函数,蓝色代表测试集损失函数.如图3所示,当Learning Rate为0.1和0.01时,损失函数曲线均先快速下降后趋于不变,这说明学习率设置不合理.当Learning Rate为0.000 1时,训练集和测试集的损失函数曲线准确拟合.当Learning Rate为0.001时,训练集和测试集的损失函数曲线高度拟合,说明0.001的学习率最优.分别使用0.1、0.01、0.001、0.000 1的学习率进行CNN-GRU模型训练,经过3次实验,对评价指标求均值得到表3,验证了学习率为0.001时,CNN-GRU集成模型预测AQI值误差最小,因此确定学习率为0.001.

  • 图3 不同学习率下损失函数曲线

  • Fig.3 Loss function curves with different learning rates

  • 表3 不同学习率下各评价指标情况

  • Table3 Evaluation indexes under different learning rates

  • 2) Epoch

  • Epoch是在训练神经网络时,将整个数据集通过神经网络一次的迭代次数.Epoch过小会导致CNN-GRU模型欠拟合,无法充分学习污染气体数据集特征,Epoch过大会导致CNN-GRU模型过拟合,对测试集泛化性能低.本文分别对50、100、150、200、250、300的Epoch进行测试,CNN-GRU模型在不同Epoch下损失函数的曲线如图4所示.

  • 图4中蓝色曲线代表训练集损失函数,橙色代表测试集损失函数.如图4所示,当Epoch为50、100、150、250、300时,测试集损失函数曲线均先下降,然后缓慢上升,出现过拟合现象,当Epoch为200时,测试集损失函数曲线稳定下降,下降趋势与训练集损失函数曲线相似,说明Epoch选择200最优.分别使用30、50、100、150、250、300的Epoch进行CNN-GRU模型训练,经过3次实验,对评价指标求均值得到表4,验证了Epoch为200时,CNN-GRU集成模型预测AQI的误差最小,因此确定Epoch为200.

  • 表4 不同Epoch下各评价指标情况

  • Table4 Evaluation indexes under different Epochs

  • 图4 不同Epoch下损失函数曲线

  • Fig.4 Loss function curves under different Epochs

  • 3) Batch_size

  • Batch_size是CNN-GRU集成模型在训练过程中一次处理的样本数量.分别使用16、32、64的Batch_size进行CNN-GRU模型训练,经过3次实验,对评价指标求均值得到表5,验证了Batch_size为32时,CNN-GRU集成模型预测AQI值误差最小,因此确定Batch_size为32.

  • 表5 不同Batch_size下各评价指标情况

  • Table5 Evaluation indexes under different Batch_sizes

  • 4) Dropout

  • Dropout是一种常用于深度学习模型中的正则化技术,通过引入随机性来防止模型过度依赖某些特定神经元,提高模型的泛化能力.在CNN-GRU集成模型中,Dropout应用方式包括:在CNN层后面应用Dropout、在GRU层前面应用Dropout、在全连接层后面应用Dropout.分别使用0.7、0.5、0.3、0.2的Dropout率进行测试,结果表明,在GRU层前面应用0.2的Dropout,以及在CNN层后面应用0.3的Dropout率情况下,模型预测AQI的MAE为0.046 5,RMSE为0.074 5,MAPE为0.232 2,相比其他超参数配置,此超参数配置最优.

  • 5)步长

  • 在深度学习任务中,步长(Sequence Length)是指在进行卷积、池化等操作时,在输入数据上移动的时间步数量.步长决定输出的尺寸,过大的步长会导致信息丢失,过小的步长会增大计算量和过拟合风险,因此平衡步长的大小十分重要.本文分别对1、6、12的步长进行3组测试,求均值得到表6.实验证明,当步长为6时,CNN-GRU集成模型对AQI的预测误差最小,因此确定步长为6.

  • 表6 不同步长下各评价指标情况

  • Table6 Evaluation indexes under different steps

  • 3 基于CNN-GRU模型的AQI预测

  • 3.1 数据收集

  • 北京作为中国的北方城市,属于温带大陆性气候区,以其四季分明、夏季炎热而冬季寒冷的气候特征而闻名.广州位于中国南方,属于亚热带季风气候区,夏季炎热潮湿而冬季相对温暖湿润.通过对两个城市的空气质量进行分析和比较,探究CNN-GRU模型在不同气候特征下对空气质量指数的预测效果,为改善和管理城市空气质量提供科学依据.

  • 本文采用2014年1月1日到2022年12月31日北京和广州的6种污染气体的日平均质量浓度数据、平均湿度、平均温度、每日空气质量指数进行实例分析,包含PM2.5(μg/m3)、PM10(μg/m3)、SO2(μg/m3)、NO2(μg/m3)、CO(mg/m3)、O3(μg/m3)、平均湿度(%)、平均温度(℃)和AQI值,数据来源于空气质量在线检测分析平台(https://www.aqistudy.cn/).除去缺失值和极端值,2022年北京和广州的AQI数据序列情况如图5所示.

  • 3.2 数据预处理

  • 2014—2022年北京PM2.5、PM10、SO2、NO2、CO、O3、AQI分别存在27、67、1、1、1、18、6条缺失值,广州O3存在12条缺失值.本文采用插值函数interpolate()来填补数据集中的缺失值,取数据框中缺失值的上一条数值和下一条数值的平均值代替原缺失值.

  • 将数据集以7∶3的比例划分训练集和测试集,即将前70%的污染气体质量浓度和AQI数据作为训练集,剩下30%的污染气体质量浓度和AQI数据作为测试集.同时,设置特定步长的移动窗口进行平滑移动训练和预测.

  • 为了降低由于量纲不同导致的预测误差,本文采用离差标准化对污染气体质量浓度和AQI数据进行标准化处理,将数据映射到[0,1]之间,公式如下:

  • X'=X-Xmin Xmax-Xmin ,
    (9)
  • 式中,X′为归一化后数据,X为原数据,Xmin为数据最小值,Xmax为数据最大值.

  • 3.3 特征组合选择与模型对比

  • 为研究特征组合对AQI预测效果的影响,并验证CNN-GRU模型是否为AQI预测的最优集成模型,本文分别在两组特征组合下使用多元宇宙优化的广义回归神经网络模型(MVO-GRNN)、遗传算法优化的BP神经网络模型(GA-BP)和CNN-GRU模型对2014—2022年北京、广州的AQI进行预测,使用MAE、RMSE、MAPE 3种指标评价预测效果.第一组特征包括PM2.5、PM10、SO2、CO、NO2和O3,其预测结果如表7所示.第二组特征包括PM10、SO2、CO、O3、平均湿度和平均温度,其预测结果如表8所示.

  • 表7 第一组特征下AQI预测结果

  • Table7 AQI prediction results under the first group of characteristics

  • 实验结果表明,对于第一组特征组合(PM2.5、PM10、SO2、CO、NO2和O3),3种模型在AQI预测方面表现出不同的效果,CNN-GRU模型表现最好,显示出较低的误差值,说明该模型在预测AQI时具有较高的准确性.与第一组特征组合相比,第二组特征组合(PM10、SO2、CO、O3、平均湿度和平均温度)的预测性能下降.第二组特征下CNN-GRU模型比MVO-GRNN模型、GA-BP模型表现更好,但相比第一组特征组合显示出相对较高的误差值.

  • 图5 2022年北京、广州的AQI数据序列

  • Fig.5 AQI data series of Beijing and Guangzhou in 2022

  • 表8 第二组特征下AQI预测结果

  • Table8 AQI prediction results under the second group of characteristics

  • 综上所述,在PM2.5、PM10、SO2、CO、NO2和O3的特征组合下CNN-GRU集成深度学习模型预测AQI的误差值最低,更能实现对城市空气质量指数的精准预测.

  • 3.4 AQI分季节预测情况

  • 为验证CNN-GRU模型在分季节和小容量下的预测效果,对2014—2022年北京、广州的AQI和相关污染物数据以春(3—5月)夏(6—8月)秋(9—11月)冬(12月—次年2月)的划分准则[19]进行季节划分,结果分别如图6和图7所示.

  • 使用CNN-GRU模型对北京的AQI预测时,春季、夏季、秋季、冬季预测的MAE分别为0.057 8、0.057 8、0.053 0、0.051 3,RMSE分别为0.104 3、0.104 3、0.070 9、0.101 2,MAPE分别为0.246 7、0.246 7、0.245 1、0.233 2.相比之下,使用GA-BP模型和MVO-GRNN模型对相同数据进行分季节预测的结果则有所不同.MVO-GRNN模型在不同季节下的预测误差值变化较大,不稳定.以MAE为例,春季、夏季、秋季、冬季预测的MAE分别为17.632 9、8.809 5、16.690 7、20.453 4.而GA-BP模型的预测误差变化更为明显,春季、夏季、秋季、冬季预测的MAE分别为18.515 0、1.976 7、9.592 1、11.506 0.这表明GA-BP模型和MVO-GRNN模型在不同季节下对AQI的预测不如CNN-GRU模型稳定.从图7可见,对于广州的AQI分季节预测,GA-BP模型和MVO-GRNN模型同样表现出不稳定,例如,GA-BP模型冬季预测的RMSE比秋季增高8.640 5,MVO-GRNN模型冬季预测的RMSE比夏季增高6.596 5.相比于这两种模型,CNN-GRU模型对AQI预测的误差值最低,各季节预测误差值的差均小于0.2,表现出较高的稳定性和精确性.

  • 图6 各模型对北京的AQI分季节预测效果对比

  • Fig.6 Performance comparison between models for prediction of seasonal AQI in Beijing

  • 图7 各模型对广州的AQI分季节预测效果对比

  • Fig.7 Performance comparison between models for prediction of seasonal AQI in Guangzhou

  • 4 结论

  • 针对城市空气质量时间序列具有非线性和复杂性的特点,本文构建了CNN-GRU集成深度学习模型,以2014—2022年北京和广州的空气质量数据进行实例研究,同时构建多元宇宙优化的广义回归神经网络模型(MVO-GRNN)、遗传算法优化的BP神经网络模型(GA-BP)对AQI进行对比预测.在进行整体预测后,本文使用以上3种模型分别对北京和广州的春季、夏季、秋季、冬季进行预测.通过实验得到以下4点结论:

  • 1)在研究特征组合对AQI预测效果的影响中,第一组特征组合在AQI预测中表现出更好的效果,尤其是在CNN-GRU模型下,具有更低的误差值.这表明PM2.5、PM10、SO2、CO、NO2和O3这组特征对AQI的预测起到了关键作用.

  • 2)在整体预测情况下,与MVO-GRNN模型、GA-BP模型对比,本文提出的CNN-GRU集成深度学习模型对AQI的预测更精确,验证了CNN在处理高维数据和特征提取方面的有效性,以及GRU在计算方面的高效性.

  • 3)在分季节预测情况下,与MVO-GRNN模型、GA-BP模型对比,CNN-GRU集成深度学习模型对AQI的预测更稳定,误差变化最小,不会因为季节变化而出现较大的误差波动,验证了CNN-GRU模型具有较好的泛化能力和稳定性.

  • 4)对比整体预测情况和分季节预测情况,CNN-GRU集成深度学习模型在整体预测情况下更精确,验证了CNN-GRU集成深度学习模型更适合对空气质量指数进行整体预测,可以避免考虑各季节复杂的特征变化.

  • 参考文献

    • [1] 秦耀辰,谢志祥,李阳.大气污染对居民健康影响研究进展[J].环境科学,2019,40(3):1512-1520.QIN Yaochen,XIE Zhixiang,LI Yang.Review of research on the impacts of atmospheric pollution on the health of residents[J].Environmental Science,2019,40(3):1512-1520

    • [2] 牟敬锋,赵星,樊静洁,等.基于ARIMA模型的深圳市空气质量指数时间序列预测研究[J].环境卫生学杂志,2017,7(2):102-107,117.MOU Jingfeng,ZHAO Xing,FAN Jingjie,et al.Time series prediction of AQI in Shenzhen based on ARIMA model[J].Journal of Environmental Hygiene,2017,7(2):102-107,117

    • [3] 杨思琪,赵丽华.随机森林算法在城市空气质量预测中的应用[J].统计与决策,2017(20):83-86.YANG Siqi,ZHAO Lihua.Application of random forest algorithm in urban air quality prediction[J].Statistics & Decision,2017(20):83-86

    • [4] 焦东方,孙志华.空气质量指数回归分析[J].中国海洋大学学报(自然科学版),2018,48(增刊2):228-234.JIAO Dongfang,SUN Zhihua.Regression analysis of air quality index[J].Periodical of Ocean University of China,2018,48(sup2):228-234

    • [5] Shishegaran A,Saeedi M,Kumar A,et al.Prediction of air quality in Tehran by developing the nonlinear ensemble model[J].Journal of Cleaner Production,2020,259:120825

    • [6] Phruksahiran N.Improvement of air quality index prediction using geographically weighted predictor methodology[J].Urban Climate,2021,38:100890

    • [7] 胡青,龚世才,胡珍.基于改进麻雀搜索算法的空气质量指数预测[J].广西科学,2022,29(4):642-651.HU Qing,GONG Shicai,HU Zhen.Air quality index prediction based on improved sparrow search algorithm[J].Guangxi Sciences,2022,29(4):642-651

    • [8] 孙启森,张建新,程海阳,等.基于注意力的卷积神经网络金融时序数据预测[J].计算机应用,2022,42(增刊2):290-295.SUN Qisen,ZHANG Jianxin,CHENG Haiyang,et al.Financial time series data prediction by attention-based convolutional neural network[J].Journal of Computer Applications,2022,42(sup2):290-295

    • [9] 袁培森,黎薇,任守纲,等.基于卷积神经网络的菊花花型和品种识别[J].农业工程学报,2018,34(5):152-158.YUAN Peisen,LI Wei,REN Shougang,et al.Recognition for flower type and variety of chrysanthemum with convolutional neural network[J].Transactions of the Chinese Society of Agricultural Engineering,2018,34(5):152-158

    • [10] Shujaat M,Wahab A,Tayara H,et al.pcPromoter-CNN:a CNN-based prediction and classification of promoters[J].Genes,2020,11(12):1529

    • [11] 周飞燕,金林鹏,董军.卷积神经网络研究综述[J].计算机学报,2017,40(6):1229-1251.ZHOU Feiyan,JIN Linpeng,DONG Jun.Review of convolutional neural network[J].Chinese Journal of Computers,2017,40(6):1229-1251

    • [12] 杨丽,吴雨茜,王俊丽,等.循环神经网络研究综述[J].计算机应用,2018,38(S2):1-6,26.YANG Li,WU Yuxi,WANG Junli,et al.Research on recurrent neural network[J].Journal of Computer Applications,2018,38(S2):1-6,26

    • [13] Liu P H,Liu J,Wu K.CNN-FCM:system modeling promotes stability of deep learning in time series prediction[J].Knowledge-Based Systems,2020,203:106081

    • [14] 罗建豪,吴建鑫.基于深度卷积特征的细粒度图像分类研究综述[J].自动化学报,2017,43(8):1306-1318.LUO Jianhao,WU Jianxin.A survey on fine-grained image categorization using deep convolutional features[J].Acta Automatica Sinica,2017,43(8):1306-1318

    • [15] 王艳平,韩晓冰.基于CNN的主动悬架传感器故障诊断[ J/OL]. 控制工程:1⁃6 [ 2022⁃11⁃22]. https://kns. cnki.net/kcms2/article/abstract?v = 3uoqIhG8C45S0n⁃ 9fL2suRadTyEVl2pW9UrhTDCdPD64wIMnTVGX3TlB⁃ 19tACLaj6qrspFdwKw3wbBCaM13H3OmPugJRq6N6D⁃ &uniplatform=NZKPT.WANG Yanping,HAN Xiaobing. CNN⁃based active sus⁃ pension sensor fault diagnosis [ J/OL ]. Control Engineering:1⁃6[2022⁃11⁃22].https://kns.cnki.net/kc⁃ ms2/article/abstract?v = 3uoqIhG8C45S0n9fL2suRad⁃ TyEVl2pW9UrhTDCdPD64wIMnTVGX3TlB19tACLaj6⁃ qrspFdwKw3wbBCaM13H3OmPugJRq6N6D&unipl⁃ atform=NZKPT

    • [16] 蔡薇薇,徐彦伟,颉潭成.基于CNN-LSTM的轴承剩余使用寿命预测[J].机械传动,2022,46(10):17-23.CAI Weiwei,XU Yanwei,XIE Tancheng.Prediction of bearing remaining service life based on CNN-LSTM[J].Journal of Mechanical Transmission,2022,46(10):17-23

    • [17] Cho K,van Merrienboer B,Gulcehre C,et al.Learning phrase representations using RNN encoder-decoder for statistical machine translation[J].arXiv e-print,2014,arXiv:1406.1078

    • [18] Hochreiter S,Schmidhuber J.Long short-term memory[J].Neural Computation,1997,9(8):1735-1780

    • [19] 彭豪杰,周杨,胡校飞,等.基于深度学习与随机森林的PM2.5浓度预测模型[J].遥感学报,2023,27(2):430-440.PENG Haojie,ZHOU Yang,HU Xiaofei,et al.A PM2.5 prediction model based on deep learning and random forest[J].Journal of Remote Sensing,2023,27(2):430-440

  • 参考文献

    • [1] 秦耀辰,谢志祥,李阳.大气污染对居民健康影响研究进展[J].环境科学,2019,40(3):1512-1520.QIN Yaochen,XIE Zhixiang,LI Yang.Review of research on the impacts of atmospheric pollution on the health of residents[J].Environmental Science,2019,40(3):1512-1520

    • [2] 牟敬锋,赵星,樊静洁,等.基于ARIMA模型的深圳市空气质量指数时间序列预测研究[J].环境卫生学杂志,2017,7(2):102-107,117.MOU Jingfeng,ZHAO Xing,FAN Jingjie,et al.Time series prediction of AQI in Shenzhen based on ARIMA model[J].Journal of Environmental Hygiene,2017,7(2):102-107,117

    • [3] 杨思琪,赵丽华.随机森林算法在城市空气质量预测中的应用[J].统计与决策,2017(20):83-86.YANG Siqi,ZHAO Lihua.Application of random forest algorithm in urban air quality prediction[J].Statistics & Decision,2017(20):83-86

    • [4] 焦东方,孙志华.空气质量指数回归分析[J].中国海洋大学学报(自然科学版),2018,48(增刊2):228-234.JIAO Dongfang,SUN Zhihua.Regression analysis of air quality index[J].Periodical of Ocean University of China,2018,48(sup2):228-234

    • [5] Shishegaran A,Saeedi M,Kumar A,et al.Prediction of air quality in Tehran by developing the nonlinear ensemble model[J].Journal of Cleaner Production,2020,259:120825

    • [6] Phruksahiran N.Improvement of air quality index prediction using geographically weighted predictor methodology[J].Urban Climate,2021,38:100890

    • [7] 胡青,龚世才,胡珍.基于改进麻雀搜索算法的空气质量指数预测[J].广西科学,2022,29(4):642-651.HU Qing,GONG Shicai,HU Zhen.Air quality index prediction based on improved sparrow search algorithm[J].Guangxi Sciences,2022,29(4):642-651

    • [8] 孙启森,张建新,程海阳,等.基于注意力的卷积神经网络金融时序数据预测[J].计算机应用,2022,42(增刊2):290-295.SUN Qisen,ZHANG Jianxin,CHENG Haiyang,et al.Financial time series data prediction by attention-based convolutional neural network[J].Journal of Computer Applications,2022,42(sup2):290-295

    • [9] 袁培森,黎薇,任守纲,等.基于卷积神经网络的菊花花型和品种识别[J].农业工程学报,2018,34(5):152-158.YUAN Peisen,LI Wei,REN Shougang,et al.Recognition for flower type and variety of chrysanthemum with convolutional neural network[J].Transactions of the Chinese Society of Agricultural Engineering,2018,34(5):152-158

    • [10] Shujaat M,Wahab A,Tayara H,et al.pcPromoter-CNN:a CNN-based prediction and classification of promoters[J].Genes,2020,11(12):1529

    • [11] 周飞燕,金林鹏,董军.卷积神经网络研究综述[J].计算机学报,2017,40(6):1229-1251.ZHOU Feiyan,JIN Linpeng,DONG Jun.Review of convolutional neural network[J].Chinese Journal of Computers,2017,40(6):1229-1251

    • [12] 杨丽,吴雨茜,王俊丽,等.循环神经网络研究综述[J].计算机应用,2018,38(S2):1-6,26.YANG Li,WU Yuxi,WANG Junli,et al.Research on recurrent neural network[J].Journal of Computer Applications,2018,38(S2):1-6,26

    • [13] Liu P H,Liu J,Wu K.CNN-FCM:system modeling promotes stability of deep learning in time series prediction[J].Knowledge-Based Systems,2020,203:106081

    • [14] 罗建豪,吴建鑫.基于深度卷积特征的细粒度图像分类研究综述[J].自动化学报,2017,43(8):1306-1318.LUO Jianhao,WU Jianxin.A survey on fine-grained image categorization using deep convolutional features[J].Acta Automatica Sinica,2017,43(8):1306-1318

    • [15] 王艳平,韩晓冰.基于CNN的主动悬架传感器故障诊断[ J/OL]. 控制工程:1⁃6 [ 2022⁃11⁃22]. https://kns. cnki.net/kcms2/article/abstract?v = 3uoqIhG8C45S0n⁃ 9fL2suRadTyEVl2pW9UrhTDCdPD64wIMnTVGX3TlB⁃ 19tACLaj6qrspFdwKw3wbBCaM13H3OmPugJRq6N6D⁃ &uniplatform=NZKPT.WANG Yanping,HAN Xiaobing. CNN⁃based active sus⁃ pension sensor fault diagnosis [ J/OL ]. Control Engineering:1⁃6[2022⁃11⁃22].https://kns.cnki.net/kc⁃ ms2/article/abstract?v = 3uoqIhG8C45S0n9fL2suRad⁃ TyEVl2pW9UrhTDCdPD64wIMnTVGX3TlB19tACLaj6⁃ qrspFdwKw3wbBCaM13H3OmPugJRq6N6D&unipl⁃ atform=NZKPT

    • [16] 蔡薇薇,徐彦伟,颉潭成.基于CNN-LSTM的轴承剩余使用寿命预测[J].机械传动,2022,46(10):17-23.CAI Weiwei,XU Yanwei,XIE Tancheng.Prediction of bearing remaining service life based on CNN-LSTM[J].Journal of Mechanical Transmission,2022,46(10):17-23

    • [17] Cho K,van Merrienboer B,Gulcehre C,et al.Learning phrase representations using RNN encoder-decoder for statistical machine translation[J].arXiv e-print,2014,arXiv:1406.1078

    • [18] Hochreiter S,Schmidhuber J.Long short-term memory[J].Neural Computation,1997,9(8):1735-1780

    • [19] 彭豪杰,周杨,胡校飞,等.基于深度学习与随机森林的PM2.5浓度预测模型[J].遥感学报,2023,27(2):430-440.PENG Haojie,ZHOU Yang,HU Xiaofei,et al.A PM2.5 prediction model based on deep learning and random forest[J].Journal of Remote Sensing,2023,27(2):430-440

  • 地址:江苏省南京市宁六路219号    邮编:210044

    联系电话:025-58731025    E-mail:nxdxb@nuist.edu.cn

    南京信息工程大学学报 ® 2024 版权所有  技术支持:北京勤云科技发展有限公司