en
×

分享给微信好友或者朋友圈

使用微信“扫一扫”功能。
作者简介:

王静,女,硕士生,研究方向为PM2.5等时空数据建模及分析.jwang_jane@163.com;

曹春正(通信作者),男,教授,主要研究方向为函数型数据分析、气象中的复杂数据建模及分析.caochunzheng@163.com

中图分类号:X513

文献标识码:A

DOI:10.13878/j.cnki.jnuist.2023.01.004

参考文献 1
Pope C A III,Burnett R T,Thun M J,et al.Lung cancer,cardiopulmonary mortality,and long-term exposure to fine particulate air pollution[J].JAMA,2002,287(9):1132-1141
参考文献 2
Guo Y M,Jia Y P,Pan X C,et al.The association between fine particulate air pollution and hospital emergency room visits for cardiovascular diseases in Beijing,China[J].Science of the Total Environment,2009,407(17):4826-4830
参考文献 3
郭玉明,刘利群,陈建民,等.大气可吸入颗粒物与心脑血管疾病急诊关系的病例交叉研究[J].中华流行病学杂志,2008,29(11):1064-1068;GUO Yuming,LIU Liqun,CHEN Jianmin,et al.Association between the concentration of particulate matters and the hospital emergency room visits for circulatory diseases:a case-crossover study[J].Chinese Journal of Epidemiology,2008,29(11):1064-1068
参考文献 4
Valavanidis A,Fiotakis K,Vlachogianni T.Airborne particulate matter and human health:toxicological assessment and importance of size and composition of particles for oxidative damage and carcinogenic mechanisms[J].Journal of Environmental Science and Health,Part C:Environmental Carcinogenesis & Ecotoxicology Reviews,2008,26(4):339-362
参考文献 5
Samet J M,DeMarini D M,Malling H V.Do airborne particles induce heritable mutations?[J].Science,2004,304(5673):971-972
参考文献 6
Guo S,Hu M,Zamora M L,et al.Elucidating severe urban haze formation in China[J].Proceedings of the National Academy of Sciences of the United States of America,2014,111(49):17373-17378
参考文献 7
Sun Y L,Wang Z F,Du W,et al.Long-term real-time measurements of aerosol particle composition in Beijing,China:seasonal variations,meteorological effects,and source analysis[J].Atmospheric Chemistry and Physics,2015,15(17):10149-10165
参考文献 8
卢月明,王亮,仇阿根,等.局部加权线性回归模型的PM2.5空间插值方法[J].测绘科学,2018,43(11):79-84,91;LU Yueming,WANG Liang,QIU Agen,et al.PM2.5 spatial interpolation method based on local weighted linear regression model[J].Science of Surveying and Mapping,2018,43(11):79-84,91
参考文献 9
Gething P,Atkinson P,Noor A,et al.A local space-time Kriging approach applied to a national outpatient malaria dataset[J].Computers & Geosciences,2007,33(10):1337-1350
参考文献 10
Byun D,Schere K L.Review of the governing equations,computational algorithms,and other components of the models-3 community multiscale air quality(CMAQ)modeling system[J].Applied Mechanics Reviews,2006,59(2):51-77
参考文献 11
李颖若,汪君霞,韩婷婷,等.利用多元线性回归方法评估气象条件和控制措施对APEC期间北京空气质量的影响[J].环境科学,2019,40(3):1024-1034;LI Yingruo,WANG Junxia,HAN Tingting,et al.Using multiple linear regression method to evaluate the impact of meteorological conditions and control measures on air quality in Beijing during APEC 2014[J].Environmental Science,2019,40(3):1024-1034
参考文献 12
Sorek-Hamer M,Strawa A W,Chatfield R B,et al.Improved retrieval of PM2.5 from satellite data products using non-linear methods[J].Environmental Pollution,2013,182C:417-423
参考文献 13
Yu S,Wang G N,Wang L,et al.Estimation and inference for generalized geoadditive models[J].Journal of the American Statistical Association,2020,115(530):761-774
参考文献 14
Bai Y,Li Y,Wang X X,et al.Air pollutants concentrations forecasting using back propagation[J].Atmospheric Pollution Research,2016,7(3):557-566
参考文献 15
Zhou Q P,Jiang H Y,Wang J Z,et al.A hybrid model for PM2.5 forecasting based on ensemble empirical mode decomposition and a general regression neural network[J].Science of the Total Environment,2014,496:264-274
参考文献 16
白盛楠,申晓留.基于LSTM循环神经网络的PM2.5预测[J].计算机应用与软件,2019,36(1):67-70,104;BAI Shengnan,SHEN Xiaoliu.PM2.5 prediction based on LSTM recurrent neural network[J].Computer Applications and Software,2019,36(1):67-70,104
参考文献 17
Cheam A S M,Marbac M,McNicholas P D.Model-based clustering for spatiotemporal data on air quality monitoring[J].Environmetrics,2017,28(3):e2437
参考文献 18
Clifford S,Low-Choy S,Mazaheri M,et al.A Bayesian spatiotemporal model of panel design data:airborne particle number concentration in Brisbane,Australia[J].Environmetrics,2019,30(7):e2597
参考文献 19
Nicolis O,Díaz M,Sahu S K,et al.Bayesian spatiotemporal modeling for estimating short-term exposure to air pollution in Santiago de Chile[J].Environmetrics,2019,30(7):e2574
参考文献 20
Padilla L,Lagos-Álvarez B,Mateu J,et al.Space-time autoregressive estimation and prediction with missing data based on Kalman filtering[J].Environmetrics,2020,31(7):e2627
参考文献 21
Wan Y T,Xu M Y,Huang H,et al.A spatio-temporal model for the analysis and prediction of fine particulate matter concentration in Beijing[J].Environmetrics,2021,32(1):e2648
参考文献 22
Bakar K S,Sahu S K.spTimer:spatio-temporal Bayesian modeling using R[J].Journal of Statistical Software,2015,63(15):1-32
参考文献 23
梁丽思,靖娟利,王安娜,等.2014—2019年冬季京津冀地区PM2.5质量浓度时空分布特征[J].桂林理工大学学报,2020,40(4):788-797;LIANG Lisi,JING Juanli,WANG Anna,et al.Spatial-temporal distribution characteristics of PM2.5 concentrations in Beijing-Tianjin-Hebei region in winter from 2014 to 2019[J].Journal of Guilin University of Technology,2020,40(4):788-797
参考文献 24
王晨,时悦,景悦,等.基于遥感数据的京津冀地区PM2.5时空分布特征[J].环境监测管理与技术,2020(1):37-41;WANG Chen,SHI Yue,JING Yue,et al.Spatial and temporal distribution characteristics of PM2.5 in Beijing-Tianjin-Hebei region based on remote sensing data[J].The Administration and Technique of Environmental Monitoring,2020(1):37-41
参考文献 25
Handcock M S,Stein M L.A Bayesian analysis of Kriging[J].Technometrics,1993,35(4):403-410
参考文献 26
Gelfand A E.Hierarchical modeling for spatial data problems[J].Spatial Statistics,2012,1:30-39
目录contents

    摘要

    为解决PM2.5的多站点同步预测问题,提出一种贝叶斯框架下的分层自回归时空模型.将PM2.5日均浓度真实值视为潜在时空过程,利用一阶自回归过程刻画时间相关性,并基于Matérn过程捕获空间相关性,极大程度地提高了降维和同步预测的效率.此外,还将日最高温度、相对湿度和风速等气象因素作为解释变量,用于提升PM2.5的预测效果.借助模型的分层结构,通过贝叶斯方法结合马尔可夫链蒙特卡罗(MCMC)算法实现参数估计和预测过程.对北京市日均PM2.5浓度的实证分析表明,模型在空间和时间维度上均有良好的插值或预测效果.

    Abstract

    Here,a hierarchical autoregressive spatio-temporal model under the Bayesian framework is proposed to address the simultaneous multi-site PM2.5 prediction.The true daily average concentration of PM2.5 is regarded as a potential spatio-temporal process,then the temporal correlation is described by the first-order autoregressive process and the spatial correlation is captured based on the Matérn process,which greatly improves the efficiency in dimension reduction and synchronous prediction.In addition,meteorological factors such as daily maximum temperature,relative humidity and wind speed are used as explanatory variables to improve the prediction accuracy.The combination of Bayesian method and MCMC can realize parameter estimation and prediction process due to the model's hierarchical structure.The empirical analysis of daily PM2.5 concentration in Beijing shows that the proposed model has good interpolation or prediction performance in both spatial and temporal dimensions.

  • 0 引言

  • PM2.5作为主要空气污染物之一,由于粒径小,可以直接被人体吸入,且在大气中的停留时间长、输送距离远,因而对人体健康和大气环境质量的影响很大.医学研究表明,过高浓度的PM2.5不仅会导致心肺疾病发病率和死亡率升高[1],而且还会对人体的心血管系统、神经系统和免疫系统造成影响[2-3],甚至会对染色体和 DNA 等不同水平的遗传物质产生毒性作用,引起癌症和出生缺陷的发生[4-5].

  • PM2.5的研究工作包括数据采集方法、机理成因和影响因素等[6-7].从统计学的角度,一个地区一段时间的PM2.5浓度作为典型的时空数据集,相关研究重点是空间插值以及时间上的短期或长期预测等.PM2.5的空间插值较流行的是时空克里金方法[8-9],该方法能够基于时空数据时空位置关系与时空变异特征,实现对未观测位置的线性无偏最优估计,而PM2.5在时间维度上的预测可使用机理分析或统计建模方法等.机理分析方法主要对大气污染物的产生、转换和扩散的物理化学过程进行建模,如CMAQ模型[10]等; 统计建模方法即通过数据捕捉特征,得到污染物浓度变化规律,包括多元线性回归(Multivariable Linear Regression,MLR)[11]、广义加性模型(Generalized Additive Model,GAM)[12-13],以及统计学习模型,如BP神经网络[14]和长短期记忆网络模型(Long Short-Term Memory,LSTM)[15-16]等的各种扩展模型.相比机理分析方法,统计方法较少依赖于污染源数据、传输模式和物理机理,更侧重数据本身的规律,定量分析的精确度更具优势,是处理复杂数据的强有力工具.

  • 近年来,许多研究关注于PM2.5浓度的时空特征和统计推断.例如:Cheam等[17]将EM算法应用于参数时空混合模型的推断中,用于对空气质量数据进行聚类; Clifford等[18]在半参数时空模型的基础上,利用高斯马尔可夫随机场对空间随机效应和非参数时间趋势进行近似,对大气颗粒物浓度进行预测等贝叶斯推断.这些研究更多关注模型和计算的灵活性,没有考虑在触发空气污染方面起重要作用的气象变量.也有一些研究开发了包含气象变量的时空模型,并将其用于时空预测[19-20],包括Wan等[21]通过建立精细的参数统计模型对北京市PM2.5浓度进行综合研究,分析PM2.5浓度的时空依赖结构并进行了预测.但是在应对大规模数据,特别是多站点同步预测时,此类时空模型将面临过高的计算复杂度难题.

  • 本文在贝叶斯框架下,结合分层模型理论,同时考虑气象因素,对北京市35个空气质量监测点的日均PM2.5浓度整体建立了贝叶斯分层自回归(Bayesian Hierarchical Autoregression,BHAR)时空模型.模型有三个优点:一是利用分层结构描述出清晰的变量关联性和时空结构关系; 二是利用贝叶斯方法可同时达到参数估计和多站点同步预测的目的; 三是可以对除现有空气质量监测点之外,有气象信息的地点进行预测,解决部分地区空气质量监测点分布稀疏的问题.BHAR时空模型在潜在时空过程中同时对时间和空间相关性进行拟合,实现降维,解决了传统时空模型计算复杂度较高的问题.进一步借助R软件中的spTimer包[22],使用马尔可夫链蒙特卡罗(Markov Chain Monte Carlo,MCMC)算法对模型进行参数估计和预测.

  • 1 数据初步分析

  • 本文的研究区域北京位于115.7°~117.4°E,39.4°~41.6°N,地势西北高、东南低.西部、北部和东北部三面环山,东南部平原逐渐向渤海倾斜,见图1.

  • 北京市原有27个空气质量监测点,2012年新增了8个PM2.5监测点.由于从2021年1月23日起,北京市生态环境监测中心的空气质量发布平台(http://zx.bjmemc.com.cn)更新了北京市的空气质量监测点名称,按照城六区、东南部、东北部、西南部、西北部五个区域对监测点重新进行了划分(表1),同时考虑到PM2.5污染多发生在冬季[23],因此本文收集了北京市35个监测点2021年2月1日至2021年3月31日每天24 h的PM2.5质量浓度(μg/m3)数据用于后续分析.本文将基于采集数据对PM2.5每日24 h的平均质量浓度(日均质量浓度)进行建模和预测.

  • 为初步探索北京市PM2.5浓度的时空分布特征,首先分别按小时计算所有站点一天中每一小时的PM2.5平均质量浓度,按天计算一周中每一天的平均质量浓度,然后绘制箱线图.由图2a可以观察到,PM2.5质量浓度在一天中呈现出先下降再上升的趋势,自凌晨起逐渐下降,直至14时开始出现明显上升趋势,这可能与地形和冬季的气候条件有关,这些条件导致了热逆温和早晨、晚上的弱风,阻止了污染物扩散[24]; 同时,还可以发现在早高峰和晚高峰时间段内,PM2.5质量浓度有小幅度上升,可能是受到汽车尾气的影响.图2b显示PM2.5在一周中的变化也具有规律性,随着一周的人类活动水平不断提高,PM2.5质量浓度也逐渐升高,而周一和休息日,PM2.5质量浓度明显较低.

  • 接下来分析北京PM2.5浓度的空间分布特征.首先绘制2021年2月和3月北京市的平均PM2.5质量浓度空间分布图.由图3可以观察到北部山区的PM2.5质量浓度较低,其中延庆县的浓度最低,可能是受到了山谷地形的影响,而中心城区的PM2.5质量浓度较高显然也是合理的.

  • 然后借助全局莫兰指数分析PM2.5质量浓度分布的空间自相关性.全局莫兰指数公式为

  • I=ni=1n j=1n wijyi-y-yj-y-i=1n j=1n wiji=1n yi-y-2,
    (1)
  • 式中wij是距离权重,代表站点ij之间的加权距离,yi代表PM2.5质量浓度值.经过计算得到PM2.5质量浓度的全局莫兰指数I =0.2,为正值,且显著性检验p值等于3.9×10-6,说明北京市35个空气质量监测点2—3月PM2.5质量浓度分布存在显著的正相关性及空间聚集性.

  • 进一步收集北京地区延庆、密云、北京三个气象台站2021年2月1日到2021年3月31日每日的风速(m/s)、相对湿度(%)和最高温度(℃)数据,数据来自中国气象数据网(http://data.cma.cn).将三个气象变量分别简记为WS、RH和MT,详细汇总信息见表2.为了分析各气象变量和PM2.5质量浓度的相关性,首先为三个气象站匹配了距离最近的空气质量监测点.与延庆、密云和北京三个气象站相匹配的空气质量监测点分别为延庆夏都、怀柔新城以及大兴黄村三个监测点.分别计算PM2.5质量浓度与三个气象变量的Spearman相关系数,结果见表2最后一列.结果表明,相对湿度与PM2.5呈现出较强的正相关.2—3月北京的相对湿度比较低,此时大气污染物的化学聚合作用使得PM2.5增加的速率,高于沉降作用使得PM2.5降低的速率.相对湿度对PM2.5影响呈正向,即PM2.5质量浓度随着相对湿度的上升而增加.风速与PM2.5呈现负相关,而温度与PM2.5相关性较弱.

  • 表1 北京市空气质量监测站点

  • Table1 Air quality monitoring stations in Beijing

  • 图1 北京市地形及空气质量监测站点分布(绿点)

  • Fig.1 Map of Beijing's topography and its air quality monitoring stations (green dots)

  • 图2 2021年2—3月北京市35个空气质量监测站点一天(a)和一周(b)内的平均PM2.5质量浓度分布

  • Fig.2 Diurnal (a) and weekly (b) variation of PM2.5 concentration averaged by 35 air quality monitoring stations in Beijing from February to March 2021

  • 表2 日均PM2.5质量浓度和气象变量的信息汇总及相关系数

  • Table2 Summary of and correlation coefficients between daily PM2.5 concentrations and meteorological variables

  • 注:***表示p<0.001.

  • 图3 2021年2—3月北京市平均PM2.5质量浓度分布

  • Fig.3 Distribution of average PM2.5 concentration in Beijing from February to March 2021

  • 2 BHAR时空模型

  • 2.1 模型建立

  • 假设Zst)代表站点s在时间t的PM2.5质量浓度实际观测值,其对应的真实浓度值通过潜在的随机过程Yst)刻画,二者满足如下测量误差模型:

  • Zs,t=XTs,tβ+Ys,t+εs,t,
    (2)
  • 其中:s =s1s2,···,snn个站点的地理位置; t =1,2,···,T为时间(d); Xst)代表p维气象变量,即Xst=x1stx2stxpstT; β为回归系数; εst)为误差项,通常假定是白噪声过程,即εst)~GP(0,σε2).在空间统计中σε2通常被称为块金值,当采样点的距离为0时,半方差函数值也应为0,但由于存在测量误差和空间变异,使得两采样点非常接近时,对应半方差函数值不为0,即存在块金值.

  • 对潜在的污染物排放水平Yst)建立一阶自回归模型[22]:

  • Y(s,t)=ρY(s,t-1)+η(s,t)
    (3)
  • 其中ηst)为残差随机项,用来刻画潜在污染物排放水平的时空随机效应.假定ηst)在时间上独立而在空间上满足高斯过程GP(0,Ση),其中Ση=ση2Sηση2是不随空间变化的方差,Sη代表与空间相关的协方差矩阵,通常用Matérn族相关函数来刻画[25].此时ηst)的协方差矩阵是n ×n维的,而不是nT ×nT维的,实现了降维,简化了计算.Matérn族相关函数的一般形式为

  • κ(u;ϕ,ν)=12ν-1Γ(ν)(2νuϕ)νKν(2νuϕ),ϕ>0,ν>0,
    (4)
  • 其中:u =‖si-sj‖表示监测点sisj之间的距离,在这里选择的是欧氏距离; ϕ用来控制空间相关性的衰减速度,即距离u越大,衰减速度越快; ν为控制平滑程度的参数; Kνν阶的第二类贝塞尔函数.当ν=0.5时,Matérn族相关函数退化为指数相关函数,即κu; ϕ=exp-ϕu; 当ν=3/2时,κu; ϕ=1+ϕuexp-ϕu; 当ν→∞时,Matérn族相关函数退化为高斯过程函数,即κu; ϕ=exp-ϕ2u2.

  • 综上,对于实测数据,BHAR时空模型结构如下:

  • Zt=Xtβ+Yt+εt,
    (5)
  • Yt=ρYt-1+ηt,
    (6)
  • 其中Zt=Zs1tZsntTYt=Ys1tYsntTεt=εs1tεsntTηt=ηs1tηsntT,且εtN0σε2InηtN0ση2Sη.根据分层模型结构,BHAR时空模型可分为三层:第一层表示在给定潜在时空过程和参数的条件下原始数据的分布; 第二层表示参数给定的条件下潜在过程的分布Yt|Θ; 第三层代表引入的参数或超参数的先验分布.其中第二层中的过程可以添加不同水平的解释[26],第一水平表示真正的潜在过程,第二水平刻画了潜在过程的时空随机效应.

  • 2.2 参数估计与预测

  • BHAR时空模型中的待估参数为Θ={βρσε2ση2ϕν,利用MCMC方法进行参数估计.除了ϕν以外的其他参数都存在共轭先验分布,即在给定先验分布后βρσε2ση2都可以求出标准的满条件后验分布,进一步采用Gibbs抽样法进行参数估计.固定ν=0.5,对于参数ϕ采用Metropolis-Hastings(MH)算法进行估计.

  • Zst)的预测可以分为三类:一是预测未知监测点s0在已知时间t的值; 二是预测已知监测点s在未知时间点t0的值; 三是预测未知监测点s0在未知时间点t0的值.将第一类预测为空间插值,第二、三类预测为在时间上的预测.

  • 首先介绍空间插值,在未知监测点s0,由方程(1)可以得到:

  • Zs0,t=XTs0,tβ+Ys0,t+εs0,t,
    (7)
  • 其中Ys0t=ρYs0t-1+ηs0t.显然,Ys0t只能由t之前所有时间点的Ys0·顺序确定,且包括Ys00.可以根据初始条件Y0的先验分布来计算Ys00.当然如果指定Y0为一固定常数,那么Ys00也可以被认为是同样的常数[19],因此为了简便,Y0通常选择固定值.

  • Zs0t)的预测一般基于其后验分布πZs0tZ,该后验分布可以通过对联合后验分布积分得到:

  • π(Zs0,tZ=πZs0,tYs0,t,σε2×πYs0,tΘ,Y×π(Θ,YZ)dYs0,tdYdΘ,
    (8)
  • 上式中ZY分别代表已知时间t和监测点s的值.预测值Zs0t)的估计通过MCMC按成分抽样法获得,具体抽样方法如下:

  • 1)从后验分布πΘYZ中抽取随机样本ΘjYj;

  • 2)从后验分布πYs0tΘjYj中抽取样本Yjs0t;

  • 3)从后验分布πZs0tYjs0tσε2j中抽取样本Zjs0t.

  • 在时间维度上的预测过程与空间插值过程类似,对某一站点s(包含现有监测点或任意指定位置作为监测点),做向前一步时间预测,同样可以基于ZsT +1)的后验分布根据类似空间插值的MCMC抽样方法实现.与空间插值的不同主要体现在时间维度上的预测需要从具有零均值、方差为σ2η Sη的边缘分布出发来模拟YsT+1),而不是条件分布.因为从0时刻一直到时刻T,观测点的信息已经全部被用来获得YsT),在未来的T+1时刻,除了回归项XsT+1)的新值外,已经没有可用于条件分布的新信息.

  • 3 实例分析

  • 结合北京市35个空气质量监测点的空间分布情况,选取其中9个监测点作为空间验证集,同时选取2021年3月30日和3月31日两天作为时间验证集,剩下的26个监测点数据作为训练集用来拟合模型.利用R软件包spTimer同时实现以下参数估计和预测的计算过程.由参数估计表(表3)可以看到,WS和MT两个变量的回归系数β1β3的估计的95% 置信区间包含零点,因此是不显著的.气象变量中只有相对湿度RH的回归系数β2显著且为正值,这与数据初步分析的结果一致,进一步说明了2—3月北京的相对湿度RH对PM2.5有显著的正向影响.

  • 表3 BHAR模型的MCMC参数估计

  • Table3 MCMC parameter estimation of BHAR model

  • 为了评估BHAR时空模型的预测性能,采用均方根误差RMSE和平均绝对误差MAE两个测量指标对预测数据和原始数据进行误差对比分析.RMSE和MAE的公式如下:

  • RMSE=1ni=1n Z^i-Zi2,
    (9)
  • MAE=1ni=1n Z^i-Zi.
    (10)
  • 首先对空间验证集的9个监测点进行空间插值,BHAR时空模型可以实现对9个监测点的同步预测.为了进行对比,进一步利用R软件的mgcv包中的gam函数对训练集数据进行GAM模型拟合,预测空间验证集中各站点的PM2.5质量浓度,同时计算以上两个测量指标.Sorek-Hamer等[12] 利用GAM能够拟合解释变量与被解释变量间非线性关系的优势,提高了PM2.5质量浓度的预测效果.对比结果见表4,可以看到BHAR时空模型的RMSE和MAE都约为GAM的1/3,证明本文提出的BHAR时空模型的空间插值效果一致优于GAM.

  • 表4 空间插值效果对比

  • Table4 Comparison of spatial interpolation performance

  • 进一步,分别对空间验证集和训练集中的监测点做同步时间预测,预测3月30日和31日两天的日均PM2.5质量浓度值.选取LSTM作为主要对比模型,选取常规的ARIMA模型作为基准对比模型.将得到的测量指标列在表5中,可以看到ARIMA模型的预测效果最差,其次是LSTM模型,BHAR模型的时间预测效果最好.本文提出的BHAR时空模型对所有监测点进行整体建模,充分考虑了空间和时间相关性,因此得到了准确度较高的预测结果.

  • 表5 在时间维度上的预测效果对比

  • Table5 Comparison of prediction performance in time dimension

  • 4 总结

  • 本文建立的BHAR时空模型是将一个区域的PM2.5数据看作时间序列的空间过程,从整体上拟合PM2.5质量浓度的时间和空间相关性特征,实现了对特定站点的PM2.5空间插值和时间上的短期预测功能,预测效果优于GAM和LSTM.该模型不仅适用于PM2.5质量浓度预测,还可以推广到其他空气质量地面监测数据,例如PM10和O3浓度等.在贝叶斯框架下建模,对模型的不确定性更具有包容性,而且提前给定先验分布可以融合专家知识,提高预测精度.进一步,建立分层模型可以更加清晰地刻画出数据内部的潜在时空过程,增强模型的可解释性.同时,模型的分层结构也使得参数估计和预测等推断过程更加便捷.

  • 本文选取了风速、湿度和温度三个气象因素作为解释变量,用以提高模型的实际预测效果.为了简化模型,本文采用的是固定系数,但气象变量对PM2.5的影响也可能会随着时间和空间的变化而存在差异,因此在后续研究中将考虑拟合变系数模型.本文采用一阶自回归来刻画时间维度上的相关性,达到了较好的数值效果,同时也降低了计算复杂度.在实际应用中,可以针对数据特点,结合模型选择方法选取合适的自回归阶数.此外,本文模型中用于刻画空间相关性的Matérn核函数采用了齐次的欧氏距离,在有更多的地理细节特征下,可以考虑非齐次的欧氏距离或其他非欧距离,捕捉更为真实的空间相关性.

  • 参考文献

    • [1] Pope C A III,Burnett R T,Thun M J,et al.Lung cancer,cardiopulmonary mortality,and long-term exposure to fine particulate air pollution[J].JAMA,2002,287(9):1132-1141

    • [2] Guo Y M,Jia Y P,Pan X C,et al.The association between fine particulate air pollution and hospital emergency room visits for cardiovascular diseases in Beijing,China[J].Science of the Total Environment,2009,407(17):4826-4830

    • [3] 郭玉明,刘利群,陈建民,等.大气可吸入颗粒物与心脑血管疾病急诊关系的病例交叉研究[J].中华流行病学杂志,2008,29(11):1064-1068;GUO Yuming,LIU Liqun,CHEN Jianmin,et al.Association between the concentration of particulate matters and the hospital emergency room visits for circulatory diseases:a case-crossover study[J].Chinese Journal of Epidemiology,2008,29(11):1064-1068

    • [4] Valavanidis A,Fiotakis K,Vlachogianni T.Airborne particulate matter and human health:toxicological assessment and importance of size and composition of particles for oxidative damage and carcinogenic mechanisms[J].Journal of Environmental Science and Health,Part C:Environmental Carcinogenesis & Ecotoxicology Reviews,2008,26(4):339-362

    • [5] Samet J M,DeMarini D M,Malling H V.Do airborne particles induce heritable mutations?[J].Science,2004,304(5673):971-972

    • [6] Guo S,Hu M,Zamora M L,et al.Elucidating severe urban haze formation in China[J].Proceedings of the National Academy of Sciences of the United States of America,2014,111(49):17373-17378

    • [7] Sun Y L,Wang Z F,Du W,et al.Long-term real-time measurements of aerosol particle composition in Beijing,China:seasonal variations,meteorological effects,and source analysis[J].Atmospheric Chemistry and Physics,2015,15(17):10149-10165

    • [8] 卢月明,王亮,仇阿根,等.局部加权线性回归模型的PM2.5空间插值方法[J].测绘科学,2018,43(11):79-84,91;LU Yueming,WANG Liang,QIU Agen,et al.PM2.5 spatial interpolation method based on local weighted linear regression model[J].Science of Surveying and Mapping,2018,43(11):79-84,91

    • [9] Gething P,Atkinson P,Noor A,et al.A local space-time Kriging approach applied to a national outpatient malaria dataset[J].Computers & Geosciences,2007,33(10):1337-1350

    • [10] Byun D,Schere K L.Review of the governing equations,computational algorithms,and other components of the models-3 community multiscale air quality(CMAQ)modeling system[J].Applied Mechanics Reviews,2006,59(2):51-77

    • [11] 李颖若,汪君霞,韩婷婷,等.利用多元线性回归方法评估气象条件和控制措施对APEC期间北京空气质量的影响[J].环境科学,2019,40(3):1024-1034;LI Yingruo,WANG Junxia,HAN Tingting,et al.Using multiple linear regression method to evaluate the impact of meteorological conditions and control measures on air quality in Beijing during APEC 2014[J].Environmental Science,2019,40(3):1024-1034

    • [12] Sorek-Hamer M,Strawa A W,Chatfield R B,et al.Improved retrieval of PM2.5 from satellite data products using non-linear methods[J].Environmental Pollution,2013,182C:417-423

    • [13] Yu S,Wang G N,Wang L,et al.Estimation and inference for generalized geoadditive models[J].Journal of the American Statistical Association,2020,115(530):761-774

    • [14] Bai Y,Li Y,Wang X X,et al.Air pollutants concentrations forecasting using back propagation[J].Atmospheric Pollution Research,2016,7(3):557-566

    • [15] Zhou Q P,Jiang H Y,Wang J Z,et al.A hybrid model for PM2.5 forecasting based on ensemble empirical mode decomposition and a general regression neural network[J].Science of the Total Environment,2014,496:264-274

    • [16] 白盛楠,申晓留.基于LSTM循环神经网络的PM2.5预测[J].计算机应用与软件,2019,36(1):67-70,104;BAI Shengnan,SHEN Xiaoliu.PM2.5 prediction based on LSTM recurrent neural network[J].Computer Applications and Software,2019,36(1):67-70,104

    • [17] Cheam A S M,Marbac M,McNicholas P D.Model-based clustering for spatiotemporal data on air quality monitoring[J].Environmetrics,2017,28(3):e2437

    • [18] Clifford S,Low-Choy S,Mazaheri M,et al.A Bayesian spatiotemporal model of panel design data:airborne particle number concentration in Brisbane,Australia[J].Environmetrics,2019,30(7):e2597

    • [19] Nicolis O,Díaz M,Sahu S K,et al.Bayesian spatiotemporal modeling for estimating short-term exposure to air pollution in Santiago de Chile[J].Environmetrics,2019,30(7):e2574

    • [20] Padilla L,Lagos-Álvarez B,Mateu J,et al.Space-time autoregressive estimation and prediction with missing data based on Kalman filtering[J].Environmetrics,2020,31(7):e2627

    • [21] Wan Y T,Xu M Y,Huang H,et al.A spatio-temporal model for the analysis and prediction of fine particulate matter concentration in Beijing[J].Environmetrics,2021,32(1):e2648

    • [22] Bakar K S,Sahu S K.spTimer:spatio-temporal Bayesian modeling using R[J].Journal of Statistical Software,2015,63(15):1-32

    • [23] 梁丽思,靖娟利,王安娜,等.2014—2019年冬季京津冀地区PM2.5质量浓度时空分布特征[J].桂林理工大学学报,2020,40(4):788-797;LIANG Lisi,JING Juanli,WANG Anna,et al.Spatial-temporal distribution characteristics of PM2.5 concentrations in Beijing-Tianjin-Hebei region in winter from 2014 to 2019[J].Journal of Guilin University of Technology,2020,40(4):788-797

    • [24] 王晨,时悦,景悦,等.基于遥感数据的京津冀地区PM2.5时空分布特征[J].环境监测管理与技术,2020(1):37-41;WANG Chen,SHI Yue,JING Yue,et al.Spatial and temporal distribution characteristics of PM2.5 in Beijing-Tianjin-Hebei region based on remote sensing data[J].The Administration and Technique of Environmental Monitoring,2020(1):37-41

    • [25] Handcock M S,Stein M L.A Bayesian analysis of Kriging[J].Technometrics,1993,35(4):403-410

    • [26] Gelfand A E.Hierarchical modeling for spatial data problems[J].Spatial Statistics,2012,1:30-39

  • 参考文献

    • [1] Pope C A III,Burnett R T,Thun M J,et al.Lung cancer,cardiopulmonary mortality,and long-term exposure to fine particulate air pollution[J].JAMA,2002,287(9):1132-1141

    • [2] Guo Y M,Jia Y P,Pan X C,et al.The association between fine particulate air pollution and hospital emergency room visits for cardiovascular diseases in Beijing,China[J].Science of the Total Environment,2009,407(17):4826-4830

    • [3] 郭玉明,刘利群,陈建民,等.大气可吸入颗粒物与心脑血管疾病急诊关系的病例交叉研究[J].中华流行病学杂志,2008,29(11):1064-1068;GUO Yuming,LIU Liqun,CHEN Jianmin,et al.Association between the concentration of particulate matters and the hospital emergency room visits for circulatory diseases:a case-crossover study[J].Chinese Journal of Epidemiology,2008,29(11):1064-1068

    • [4] Valavanidis A,Fiotakis K,Vlachogianni T.Airborne particulate matter and human health:toxicological assessment and importance of size and composition of particles for oxidative damage and carcinogenic mechanisms[J].Journal of Environmental Science and Health,Part C:Environmental Carcinogenesis & Ecotoxicology Reviews,2008,26(4):339-362

    • [5] Samet J M,DeMarini D M,Malling H V.Do airborne particles induce heritable mutations?[J].Science,2004,304(5673):971-972

    • [6] Guo S,Hu M,Zamora M L,et al.Elucidating severe urban haze formation in China[J].Proceedings of the National Academy of Sciences of the United States of America,2014,111(49):17373-17378

    • [7] Sun Y L,Wang Z F,Du W,et al.Long-term real-time measurements of aerosol particle composition in Beijing,China:seasonal variations,meteorological effects,and source analysis[J].Atmospheric Chemistry and Physics,2015,15(17):10149-10165

    • [8] 卢月明,王亮,仇阿根,等.局部加权线性回归模型的PM2.5空间插值方法[J].测绘科学,2018,43(11):79-84,91;LU Yueming,WANG Liang,QIU Agen,et al.PM2.5 spatial interpolation method based on local weighted linear regression model[J].Science of Surveying and Mapping,2018,43(11):79-84,91

    • [9] Gething P,Atkinson P,Noor A,et al.A local space-time Kriging approach applied to a national outpatient malaria dataset[J].Computers & Geosciences,2007,33(10):1337-1350

    • [10] Byun D,Schere K L.Review of the governing equations,computational algorithms,and other components of the models-3 community multiscale air quality(CMAQ)modeling system[J].Applied Mechanics Reviews,2006,59(2):51-77

    • [11] 李颖若,汪君霞,韩婷婷,等.利用多元线性回归方法评估气象条件和控制措施对APEC期间北京空气质量的影响[J].环境科学,2019,40(3):1024-1034;LI Yingruo,WANG Junxia,HAN Tingting,et al.Using multiple linear regression method to evaluate the impact of meteorological conditions and control measures on air quality in Beijing during APEC 2014[J].Environmental Science,2019,40(3):1024-1034

    • [12] Sorek-Hamer M,Strawa A W,Chatfield R B,et al.Improved retrieval of PM2.5 from satellite data products using non-linear methods[J].Environmental Pollution,2013,182C:417-423

    • [13] Yu S,Wang G N,Wang L,et al.Estimation and inference for generalized geoadditive models[J].Journal of the American Statistical Association,2020,115(530):761-774

    • [14] Bai Y,Li Y,Wang X X,et al.Air pollutants concentrations forecasting using back propagation[J].Atmospheric Pollution Research,2016,7(3):557-566

    • [15] Zhou Q P,Jiang H Y,Wang J Z,et al.A hybrid model for PM2.5 forecasting based on ensemble empirical mode decomposition and a general regression neural network[J].Science of the Total Environment,2014,496:264-274

    • [16] 白盛楠,申晓留.基于LSTM循环神经网络的PM2.5预测[J].计算机应用与软件,2019,36(1):67-70,104;BAI Shengnan,SHEN Xiaoliu.PM2.5 prediction based on LSTM recurrent neural network[J].Computer Applications and Software,2019,36(1):67-70,104

    • [17] Cheam A S M,Marbac M,McNicholas P D.Model-based clustering for spatiotemporal data on air quality monitoring[J].Environmetrics,2017,28(3):e2437

    • [18] Clifford S,Low-Choy S,Mazaheri M,et al.A Bayesian spatiotemporal model of panel design data:airborne particle number concentration in Brisbane,Australia[J].Environmetrics,2019,30(7):e2597

    • [19] Nicolis O,Díaz M,Sahu S K,et al.Bayesian spatiotemporal modeling for estimating short-term exposure to air pollution in Santiago de Chile[J].Environmetrics,2019,30(7):e2574

    • [20] Padilla L,Lagos-Álvarez B,Mateu J,et al.Space-time autoregressive estimation and prediction with missing data based on Kalman filtering[J].Environmetrics,2020,31(7):e2627

    • [21] Wan Y T,Xu M Y,Huang H,et al.A spatio-temporal model for the analysis and prediction of fine particulate matter concentration in Beijing[J].Environmetrics,2021,32(1):e2648

    • [22] Bakar K S,Sahu S K.spTimer:spatio-temporal Bayesian modeling using R[J].Journal of Statistical Software,2015,63(15):1-32

    • [23] 梁丽思,靖娟利,王安娜,等.2014—2019年冬季京津冀地区PM2.5质量浓度时空分布特征[J].桂林理工大学学报,2020,40(4):788-797;LIANG Lisi,JING Juanli,WANG Anna,et al.Spatial-temporal distribution characteristics of PM2.5 concentrations in Beijing-Tianjin-Hebei region in winter from 2014 to 2019[J].Journal of Guilin University of Technology,2020,40(4):788-797

    • [24] 王晨,时悦,景悦,等.基于遥感数据的京津冀地区PM2.5时空分布特征[J].环境监测管理与技术,2020(1):37-41;WANG Chen,SHI Yue,JING Yue,et al.Spatial and temporal distribution characteristics of PM2.5 in Beijing-Tianjin-Hebei region based on remote sensing data[J].The Administration and Technique of Environmental Monitoring,2020(1):37-41

    • [25] Handcock M S,Stein M L.A Bayesian analysis of Kriging[J].Technometrics,1993,35(4):403-410

    • [26] Gelfand A E.Hierarchical modeling for spatial data problems[J].Spatial Statistics,2012,1:30-39

  • 地址:江苏省南京市宁六路219号    邮编:210044

    联系电话:025-58731025    E-mail:nxdxb@nuist.edu.cn

    南京信息工程大学学报 ® 2024 版权所有  技术支持:北京勤云科技发展有限公司