摘要
由于空间分辨率有限、物理参数化方案不够完善、泛化性较弱等原因,使得传统业务数值天气模式 (NWP)在定量降水预报中存在固有偏差,而深度学习神经网络具有强大的非线性拟合能力、能够自主性学习到任务相关的关键特征、泛化性较高等优势,有望改善现状.为此,本文提出一种基于多要素3D特征提取的短期定量降水预报技术.基于欧洲中期天气预报中心(ECMWF)提供的高分辨率ECMWF-HRES(EC-Hres)模式预报数据,构建3D-QPF(3D-Quantitative Precipitation Forecast)语义分割模型,通过先分类后回归的耦合框架,捕捉多种降水相关要素数据的3D空间特征,得到与降水实况数据间的非线性关系,并增加准确率和召回率损失函数,进一步提升模型对偏态数据的预报效果.实验结果表明,3D-QPF的逐日累积降水预报不仅在晴雨量级(0.1 mm/(24 h))准确率评分稳定增长,在暴雨量级(50 mm/(24 h))的准确率评分也有明显提升,暴雨量级较EC-Hres的TS评分最高提升了15.8%,RMSE优化达到18.71%.经过长期检验,3D-QPF模型与EC-Hres、中国气象局全球模式(CMA-GFS)预报以及2D-Unet和3D-Unet等经典网络模型相比做出了有效的预报订正效果.此外,随着预报时效延长至72 h,模型的优化效果仍能够保持相对稳定.
Abstract
Traditional Numerical Weather Prediction (NWP) models suffer from inherent biases in Quantitative Precipitation Forecasting (QPF) tasks due to limited spatial resolution,incomplete physical parameterization schemes,and poor generalization capabilities.Deep learning neural networks,with their robust nonlinear fitting capabilities,autonomous learning of task-specific features,and high generalization,hold the potential to address these issues and improve the current state of NWP.Here,we propose a novel short-term QPF approach based on multi-factor 3D feature extraction.Leveraging high-resolution ECMWF HRES (EC-Hres) model forecasting data provided by the European Centre for Medium Range Weather Forecasts (ECMWF),we construct a 3D-QPF semantic segmentation model.This model employs a coupled framework of classification and regression to capture the 3D spatial features of various precipitation-related element data,establishing a nonlinear relationship with actual precipitation data.Furthermore,we incorporate the PR (Precision-Recall) loss function to further enhance the model's predictive performance,particularly for skewed data.Experimental results show that the 3D-QPF model achieves a steady increase in accuracy score for daily cumulative precipitation forecast,not only at the light rain threshold (0.1 mm/(24 h)) but also significantly at the rainstorm threshold (50 mm/(24 h)),with a maximum improvement of 15.8% in TS (Threat Score) compared to that of EC-Hres and a reduction in RMSE (Root Mean Square Error) by 18.71%.Upon extended validation,the 3D-QPF model outperforms EC-Hres,China Meteorological Administration Global Model (CMA-GFS) forecasting,and classic network models such as 2D-Unet and 3D-Unet,demonstrating effective prediction correction.Notably,the model's optimization performance remains relatively stable even when the forecast lead time is extended to 72 hours.
0 引言
传统的数值天气预报(Numerical Weather Prediction,NWP)方法[1]需要大量的气象观测数据和计算资源来支撑其复杂的气象动力学模拟,但随着时间的推移,数据的精度和存储方式可能发生变化,导致长期维护数据的完整性变得更加困难; 且传统NWP使用的物理参数化方案对特定环境较为敏感,需根据不同的天气状况、地理和气候等条件进行调整.因此,NWP方法难以统一适用于各种气候条件,在预报准确性和泛化性上出现瓶颈[2].
近年来,计算机中数据的存储能力、计算能力呈指数级提升,深度学习凭借其高效的数据处理能力[3],可有效改善物理机制的不确定性,在气象上的应用逐渐增加.从优化或替代模式参数化方案的“软”AI,到针对数值模式进行后处理的“中度”AI,目前已发展至通过深度学习模型由实况观测数据直接预报的“硬”AI预报方式[4].如FuXi[5]、Pangu[6]、MetNet等[7]大模型,均脱离数值模式预报,直接采用多层等压面、多要素的再分析网格实况数据与预报数据之间的多元非线性关系搭建模型[8-9],在短中期、延伸期的部分要素的预报效果与主流NWP效果持平或更优,但由于输入因子、预报尺度及模型选择等问题,存在对极端天气、中小尺度系统(城市热岛、强对流等)、下垫面地形等影响考虑不足的问题.最新研究发现,大模型在预报降水、2 m气温、10 m风时并未达到理想效果[10],但在临近时效的降水、气温、风等要素预报中,“硬”AI已有较为成熟的方案和应用.如Wang等[11-12]提出并改进的PredRNN和PredRNN++模型,在LSTM的基础上增强网络对雷达回波图序列中空间变形和时间变化的学习能力;韩莹等[13]通过增加加权宽度学习系统(BLS),改善临近降水预报中存在的过拟合、时滞等现象.在短中期预报中,由于实况与预报的时间间隔较远、关联性较弱,数值模式中的大气物理过程难以替代,故更倾向于“中度”AI预报方式.温度、湿度等常规气象要素在大量观测数据下呈现趋向正态分布的特征,为深度学习方法提供了相对容易的预测条件[14-15].而降水、风速等气象要素中存在发生频率相对较低的极端事件(如强降水、飓风等),导致数据呈现出强偏态分布且具有长尾分布,且上述生成过程受局部地形、气象系统相互作用、对流及云微物理过程等多方面影响,故降水、风速等在短中期预报中需要引入更多的相关输入因子[16-17].在深度学习模型选择上,以CNN(卷积神经网络)[18]为基础的模型凭借其结构简单稳定、训练速度快、泛化能力强等优势,相较GAN[19]、Transformer[20]、Deffusion[21]为基础的复杂模型结构,在预报准确率提升上展现出广阔的应用前景.史加荣等[22]通过在特征提取前增加集合经验模态分解(EEMD),将风向序列提前分解为多个分量,改善风向序列的随机性和不平稳性等问题; Song等[23]在U-Net结构中加入残差结构和注意力,以增强模型在格点降水预报中的空间关注度.研究表明,在短期定量降水预报研究中,将CNN与数值模式相结合的“中度”AI预报方式拥有巨大潜力[24].
在利用深度学习订正NWP的短期降水预报任务中,想要获得准确率更高的客观降水预报效果,需在模型中针对要素非正态分布、样本失衡、生成过程复杂(影响因子较多)、物理可解释性较弱等问题进行具体的优化调整.本实验模型(3D-QPF)整体采用先分类后回归的耦合框架,以减少极端值样本与大样本的数量差距.在分类模型中以语义分割模型Unet为基础,通过增加3D残差注意力模块及模型结构的优化,对大气系统中复杂三维特征的捕捉能力和对损失函数的调整以增强模型对强降水等小样本事件的关注度.基于大量实验验证,3D-QPF模型在针对EC-Hres数据的24~72 h后24 h的累计降水量预报订正任务中,相较EC-Hres、中国气象局全球模式(CMA-GFS)预报以及2D-Unet和3D-Unet等经典网络模型预报效果相比,在晴雨量级(降水量:0.1 mm/(24 h))至暴雨量级(降水量:50 mm/(24 h))上均获得更高的准确率.本文结构如下:第2节介绍数据资料; 第3节详细介绍3D-QPF模型及各个模块; 第4节对不同数据处理方式和模块组合的实现效果进行分析,并与EC-Hres模式及CMA-GFS模式预报结果进行对比; 第5节给出结论与展望.
1 数据资料
1.1 输入模式数据
本文选择使用由欧洲中期天气预报中心(ECMWF)提供的2018—2022年全球高分辨率ECMWF-HRES(EC-Hres)模式预报数据[25-26],包括位势高度、气温、相对湿度、风速、2 m气温、地形等与降水生成过程密切相关的气象要素,涵盖地面层及13个标准等压面层的预报信息.由于NWP受网格分辨率的限制,在较低的网格分辨率中可能无法充分捕捉大气中的小尺度变化过程,迫使NWP在一定程度上简化描述大气中众多物理过程,这也被称为“初始条件不确定性”,同时对于预报后续复杂对流过程更是会带来一系列“累计误差”[27].即便是在较高分辨率下,不同对流活动、地形所对应的物理化参数方案等均需做出适应性的调整.上述原因使得EC-Hres模式预报时存在一定的系统性偏差,需要进行后续订正来消除此类偏差[28].
地面层和高空层要素的原始空间分辨率分别为0.125°×0.125°和0.25°×0.250°,统一双线性插值为0.1°×0.1°(1°约为111 km,网格数据大小为171×251).本文研究区域为我国中东部地区,该区域涵盖温带季风气候、亚热带湿润性季风气候和热带季风气候,夏季高温多雨,同时城市的经济发展与当地降水情况之间存在较高的相关性[29].预测区域横跨20°~37°N,98°~123°E(图1).实验采用2018—2021年合计4年预报数据构建训练集,2021年7—9月数据为验证集,2022年整年的数据作为测试集.输入的EC-Hres预测因子如表1所示.

图1预测区域(蓝色区域20°~37°N,98°~123°E)
Fig.1Prediction area (blue section, 20°-37°N, 98°-123°E)
表13D-QPF模型中使用的预测因子
Table1Prediction factors used in 3D-QPF model

1.2 标签观测降水量
CLDAS(Global Land Data Assimilation System)是中国气象局国家气象信息中心研发的一种地面气象观测数据同化系统,整合了地面站点观测资料、卫星遥感资料和欧洲中期天气预报中心数值预报资料等多源资料.通过多重网格变分融合与同化技术(STMAS)融合全国3万多个观测站数据[30],结合最优插值(OI)、概率密度函数匹配(CDF)、物理反演和地形校正等技术,生成高质量的地面气象要素数据[31].CLDAS产品主要包含温度、压力、风速、降水量、湿度和太阳短波辐射等.该数据集覆盖亚洲区域,具体范围包括0°~65°N,60°~160°E,并采用0.05°×0.05°的空间分辨率.研究表明,相较国际同类别产品,GLDAS产品在许多区域具有更高的精度和可靠性[32-33].本文使用CLDAS的逐日累积降水实况作为训练标签,并将CLDAS标签双线性插值为0.1°×0.1°,与模式因子的处理一致.
2 3D-QPF深度学习模型
2.1 三维空间特征提取
降水预报是一个有较高的非线性复杂度的任务,其生成和变化涉及多种气象因素间的相互作用和地理条件的影响,如果仅考虑简单拟合NWP的降水预报数据与降水观测,未对降水预报数据提供任何补偿信息,模型也无法学习到相关要素的复杂影响关系,从而难以提升极端降水的预报效果.同时,传统的气象预报模型通常是不考虑高度层关系的二维结构,而三维模型能更有效地捕捉到大气系统中的空间特征及不同高度下各气象变量之间的关系,可以更好地提取诸如低压系统、切变线、锋面等降水相关天气系统的不同垂直和水平三维分布特征[24,34],这在“Pangu”大模型中已得到充分验证[6].因此,在数据整合中增加空间维度,按要素种类、高度层将二维平面构造为四维数据,实现在大气系统的三维空间中建模,将所有二维卷积、池化等操作三维化,以更好地提取降水从生成至消散的演化过程.
2.2 耦合主体框架
本文提出了一种3D多要素降水预报订正模型3D-Quantitative Precipitation Forecast(3D-QPF)(如图2所示,图中方块下的数字代表当前特征图维度的).将EC-Hres模式预报数据作为输入要素因子,利用短期预报时效(24 h/48 h/72 h)气象要素数据与对应的CLDAS标签数据24 h累积降水量分别构建3套模型,进行独立训练和预测.

图23D-QPF模型结构
Fig.23D-QPF model structure
该模型由分类和回归2个部分耦合而成:1)分类部分采用3D-Unet架构[35],并对其进行优化扩展,包括残差CBAM(ReConv CBAM,图2中黄色箭头)、3D池化层(Max Pooling,图2中红色箭头)、3D双线性上采样等(UPCC,图2中深绿色箭头),该部分进行分类任务的训练,以预测降水量的离散级别; 2)回归部分采用CNN(图2中浅绿色箭头),利用分类任务中得到的各离散级别对累计降水量做精细化拟合任务.通过这种耦合方式,可有效减少极端值样本与大样本之间的数量差距,从而改善模型易受到大样本(无雨及晴雨情况)的影响的问题,使得模型预报准确率得到提升.
2.2.1 3D-Unet分类模型
首先将标签降水量处理为以下7种常见情况(表2).日均降水量超过50 mm的降雨情况会对农业、城市排水系统、交通等产生重大影响,故在模型中需重点关注.
表2标签分类等级
Table2Label classification levels

基于U-Net模型可以有效捕捉图像中的多尺度信息及定位目标边界的优势,分类任务阶段所使用的3D-Unet优化模型同样由编码器和解码器组成.编码器主要利用3D池化层做下采样,有选择性地保留关键特征,并降低特征图的尺寸,在提高泛化性的同时使得后续神经元获得更大的感知视野.同时,为模型能够更好地学习到不同要素之间和要素在各垂直高度层之间的关联性和关注度差异,引入残差CBAM.编码器部分最终将特征图像大小减小到输入图像的1/16.解码器采用3D双线性上采样取代原网络架构中的反卷积模块,在不引入新参数的情况下扩大特征图,使得网络参数量和计算复杂度得到优化,且具有更好的泛化能力.在此过程中,从较低分辨率到较高分辨率特征图中会引入一些冗余或无关信息,故在上采样过程中增加残差CBAM注意力模块帮助网络聚焦于重要特征,抑制无关信息,从而实现更精细和准确的特征表示.并通过跳过连接(skip-connection,图2中灰色箭头)将底层和高层的特征进行融合,从而实现多尺度的特征表示和传递,在缓解梯度消失问题的同时加快训练收敛.然后利用1×1的卷积层(Conv 1×1,图2中深蓝色箭头),将结果映射为7个等级的预测概率,取概率最大的级别(argmax,图2中浅蓝色箭头)作为模型结果输出.最后,由于预测范围较广,周围点可以提供更多的上下文信息,在模型输出结果中选取各点及其周围的3×3区域(共9个点)作为一个局部区域,并从这个局部区域中选择最大预测级别作为该点分类网络最后的预测结果.
分类任务中引入的残差CBAM选择沿用经典CBAM模型的主体思想,分为通道注意力和空间注意力[36],并将其推广至3D卷积网络中(图3).
通道注意力模块(Mch,式(1))通过学习不同要素之间的依赖关系,确定各要素对最终特征表示的贡献程度.使用三维自适应平均池化(图3中AvgPool)和三维自适应最大池化(图3中MaxPool)来整合全局信息,然后经多层感知器网络(图3中MLP)提高模型的表达能力,将得到的特征信息逐像素求和(图3中),并采用Sigmoid激活函数(图3中
)将其映射到[0,1]范围内,最后将得到的通道权重与输入特征图相乘(图3中),使模型更专注于相关性更高的要素特征.


图3ReConv CBAM模块结构
Fig.3ReConv CBAM structure
空间注意力部分(Ms,式(2))则通过卷积操作确定哪些高度层对降水量的预测更为重要,需受到更多的关注,生成了包含每个高度层的位置权重信息的注意力图,大小与输入特征图相同.然而,引入CBAM模块可能会带来额外的参数和对梯度产生不稳定的影响.为增强模型训练的稳定性,在CBAM模块之外添加了一层残差跳跃连接,将输入的特征直接添加到输出中,避免特征信息丢失,确保梯度能够通过跳跃连接直接反向传播到较早的层次,有助于提高训练的稳定性.
(1)
(2)
式(1)中:X表示当前网络层输入特征图; ⊙表示矩阵点乘; Sigmod表示Sigmoid激活函数; MLP表示多层感知器; avg表示三维自适应平均池化; max表示三维自适应最大池化.式(2)中:Favg、Fmax分别表示取最大值和取平均的操作; Conv7×7×7表示使用7×7×7的三维卷积核进行卷积操作.
2.2.2 CNN回归模型
由于在分类任务3D-Unet模型中,获得的离散降水级别呈现块状特性,故在回归任务中需做出精细化预报.而CNN的分层结构使其能够逐步提取抽象特征,并通过卷积核滑动窗口来捕捉输入数据的局部特征,故在拟合非线性关系的回归任务中常表现出良好的效果.首先对分类模型中得到的离散级别、对应级别发生的概率以及EC-Hres模式预报降水量进行整合、标准化、归一化以确保数据处于相同的尺度,然后构建一个包含三个卷积层的模型,每个卷积层之后跟着一个ReLU激活函数,使网络能够学习并表示更复杂的非线性关系的函数,最后添加一个全连接层,将卷积层提取的特征转换为最终的输出,并限制在分类模型预测级别内以保证误差范围不会扩大,在保证模型稳定性的同时进一步拟合累计降水量数值.
2.3 损失函数
在深度学习模型中,选择适用的损失函数对于模型的训练和性能至关重要.分类任务中常用的损失函数包括交叉熵损失函数(Cross-Entropy Loss,CEL,式(3))和焦点损失函数(Focal Loss),它们在影响模型的收敛速度、性能以及对样本不均问题的适应能力方面具有不同的优势.Focal Loss通过降低易分类样本的权重[37]而突出难分类的样本,以解决各类别之间样本不平衡的问题.但Focal Loss的性能在很大程度上受到其参数gamma的影响,而选择合适的gamma值较为困难.与之相反,交叉熵损失函数作为一种广泛应用于多分类任务中简单而有效的损失函数,在本任务中表现出了较好的基础性能.
(3)
式(3)中:N为特征图总点数; yi为模型输出未经softmax处理的值,yi∈[0,6]; 为模型输出进行softmax处理后的值,∈[0,1]; one_hot(yi)为真实值的one_hot编码,本模型为7种分类,如果yi=2,则one_hot(yi)=[0,0,1,0,0,0,0].
由于暴雨数据的样本相对较少,导致模型预报整体倾向于小量级降水.根据世界气象组织对定量降水预报准确率的评分标准(TS指标,统计模型正确预报的降水在所有实况降水及预报降水中的占比)[38],本文设计了PR损失函数(PRL,式(4)),与Tversky损失函数[39](TL,式(5))类似,通过调节准确率(P,式(6))和召回率(R,式(7))使损失函数值最小化来解决模型预测中漏报和空报的问题.但常用于二分类问题中混淆矩阵(包括真正例TP、真负例TN、假正例FP和假负例FN)的值均为离散值,存在不可微分的问题.由此引入Sigmoid函数近似阶跃函数,将α阈值级别和预测降水量等级之间做差后经过Sigmoid函数,使其转化为连续且可微的形式[40],然后与标签降水量等级中大于α阈值级别的点进行点乘运算(式(8)—(11)中使用⊙表示).本实验中采用PRL与CEL相结合的损失函数(式(12)中采用L表示),以提升模型对于暴雨事件的关注度.
(4)
(5)
(6)
(7)
(8)
(9)
(10)
(11)
(12)
式(4)中:N为样本数量; P为模型预测准确率; R为模型预测召回率.式(5)中:α、β、γ为超参数,α +β=1且0<α,β<1,γ=1.式(6)、(7)中:TP为模型预测有雨且标签预报有雨(真正例)个数; TN为模型预测无雨且标签预报无雨(真负例)个数; FP为模型预测有雨且标签预报无雨(假正例)个数; FN为模型预测无雨且标签预报有雨(假负例)个数.式(8)、(9)、(10)、(11)中:ytrue为标签降水量等级,α为设定阈值级别,本实验中设定为5(降水量大于等于25 mm时为第五等级); ypre为模型预测降水量等级.式(12)中:L表示模型最终损失值; CEL表示模型经CE损失函数得到的部分损失值; 超参数λ=0.1; PRL为模型经PR损失函数得到的部分损失值.
由图4 a可知,TL的值在一定范围内会先增大后减小,因此当P和R较小时,会出现负优化效果; 而图4 b中PRL在[0,1]范围内均保持正面优化效果,在调整P和R时更加稳定.
由图5可知:当R较大、P较小时,模型会倾向于过度预测正例而没有充分考虑准确率,这时P的导数会急剧上升,迫使损失函数值向图像的右方(P增大)进行修正,以改善模型的预测结果; 相反,当P较大时,损失函数会倾向于将模型的预测结果修正为更高的召回率,驱使损失函数朝着图像的上方(R增大)进行调整.在模型拟合的过程中,当累计降水量越大时,P和R初始值较小,损失函数值较为接近梯度下降为0的区域.为避免梯度爆炸,在后续梯度更新中步幅调整采用渐进式先增加后减小的策略,在提高模型性能的同时确保模型的稳定性和收敛性.
回归部分的CNN网络是通过均方根误差(RMSE)衡量模型预测的累计降水量与观测值之间的差异,量化模型的性能,进一步精细化拟合降水量.
(13)
式(13)中:yi表示标签降水量; 为模型预测降水量.
2.4 数据分析及处理
在自然天气中,无雨及晴雨的情况占据绝大多数,使得原始降水数据中包含许多没有降雨数据的条目,如将原始数据直接输入会导致模型倾向于预报无降水的情况[41](图6a).故将数据集中存在晴雨的区域占总预测面积大于50%的样本筛选出来,同时,为避免减少本就为数不多的暴雨数据,在预报中只要存在暴雨的条目就会被保留(原始数据条目为1 440,筛选晴雨占比大于20%数据条目为1 345,筛选晴雨占比大于50%数据条目为1 323,损耗未产生较大影响).经数据筛选后(图6 b)仍呈现为非高斯(非正态)和非对称分布的偏态数据特性,而在深度学习模型中,权重初始化、算法的优化等均依赖于正态分布的数学特性.本研究应用对数变换(式(14),X为需经对数变换的累计降水量,单位为mm)将EC-Hres模式预报累计降水量数据转换为接近正态分布的比例,并将全部输入数据按照要素种类、高度层进行独立标准化.

图4TL与PR损失函数变化趋势对比
Fig.4Comparison of Tversky Loss (TL) and Precision-Recall (PR) loss trends

图5PR损失函数偏导数值变化趋势
Fig.5Trends of partial derivatives of PR loss function

图6降水量分布变化
Fig.6Changes in precipitation distribution
(14)
3 结果与分析
3.1 实验方案
3 D-QPF模型的训练采用NVidia CUDA库和NVidia RTX 4090(GPU),Adam优化器[42],初始学习率设置为0.001,批次大小为2.在前50个epoch(训练轮次)期间,保持学习率不变,以充分学习数据的非线性关系.后续以每4个epoch评估一次大于0.1 mm累计降水量的TS评测结果,通过StepLR方法(通过乘法因子降低学习率)自适应调整学习率,如果该评测结果未增长,则将学习率降低为当前值的1/10.整体训练完成约150个epoch,约24 h.此外,如果评测结果在连续20个epoch内没有提升,则保存表现最佳的模型权重并提前终止训练.本实验中采用TS评分作为主要评估指标,并同时关注Bias(预报降水相对于实况降水的面积偏差)、POD(模型正确预报的降水在所有实况降水中的占比)和FAR(模型在未出现实际降水的情况下误报的降水在全部预报降水中的占比)等指标,以确保模型的性能优越.每日的降水量预测可以在10 s内完成,使得3D-QPF模型在预测工作中具有高度的适用性和实用性.
3.2 模型架构性能评估
为了验证本研究提出的3D-QPF模型中各模块的有效性,以2022年全年24 h预报时效的逐日累积降水量预测数据为例进行消融实验分析(表3).1)2D-Unet+RMSE:经典2D-Unet模型与RMSE损失函数直接拟合降水量作为实验基线; 2)2D-Unet+CE:经典2D-Unet模型与CE损失函数做分类任务; 3)3D-Unet+CE:经典3D-Unet模型与CE损失函数做分类任务; 4)3D+CBAM+CE:在实验3)的基础上引入残差CBAM模块; 5)3D+CBAM+CE+PRL:在实验4)的基础上将CE损失函数更换为CE与PRL相结合的损失函数; 6)3D-QPF:在实验5)的基础上增加CNN回归模型的耦合处理方式.在后续所有对比实验中:TS-i,Bias-i,Pod-i分别表示累计降水量大于i(mm)的TS,Bias,Pod评分,如TS-0.1代表累计降水量大于0.1 mm的TS评分; 评测指标后↑表示该指标数值越大效果越好,↓表示该指标数值越低效果越好; |1|*表示该指标数值越接近1效果越好.
由表3可知:实验1)中直接对降水量值进行拟合时,模型仅能提供粗略的范围预报,会导致较高的误报率(Bias-50远大于1); 将拟合问题转化为分类问题的实验2)中,虽在暴雨情况下效果没有明显改善,但TS评分呈现整体上升的趋势; 实验3)中3D模型的改动对强降水事件(降水量大于50 mm)大范围覆盖误报的问题有了明显好转,相较实验1)Bias-50 (指标与最优值1.000)的绝对误差减少了42.25%,RMSE评分降低了10.01%,强调了对大气系统的三维空间建模的重要性; 在增加残差CBAM模块的实验4)中,模型能够更好地学习到降水的区域特性和各要素间关注度的差异,预测准确率和精确度性能均显著提升,TS指标整体性能相较实验1)均有提高,但仍存在强降水预报偏低的问题.为此,在实验5)中增加PRL损失函数有针对性地优化强降水事件的预测效果,相对于实验1),TS-50增加了27.27%,Bias-50提升至1.286,在允许出现一定过报的基础上进一步提升了强降水预报性能.实验6)中,在增加回归模型后的耦合模型虽在预测准确率上无法得到提升,但相较实验1),RMSE下降13.19%.
3.3 数据处理比对评估
为验证本研究中数据的选择及其处理方式的有效性,以2022年24 h预报时效的24 h累计降水量预测数据为例,进行对比实验分析.
根据表4实验结果,第2组实验原始降水经深度学习模型训练后,首先改善高频样本(TS-0.1、TS-5)的预报表现,较原始模式(第1组)分别提升1.82%和3.38%,但强降水的TS-50指标反而下降31.72%.在第3、第4组实验进行了数据筛选和对数处理后,将强偏态分布的原始降水(≥0.1 mm)调整为类正态分布(图6c),在第4组结果中累计降水量大于50 mm的TS评分(TS-50)较第2组提升38.38%.前4组实验中仅输入单一降水要素进行拟合时,在强降水预报上仍不如第1组中EC-Hres模式预报效果好.第5、第6组实验加入多种相关要素以及3D结构处理后,模型效果再次显著提升,第6组实验相较第1组,TS-50提升了15.86%.
表3消融实验效果对比
Table3Comparison of ablation experiment effect

表4数据处理效果对比
Table4Comparison of data preprocessing effect

3.4 各时效性能评估
为验证本研究所提出的3D-QPF模型性能,对2022年全年数据的24 h、48 h、72 h后24 h累计降水量从大于0.1 mm至大于50 mm全量级效果检验,并与同期国内数值模式预报结果进行对比分析,结果如表5所示.
表5各时效降水全量级评分对比
Table5Comparison of full-range precipitation forecast scoring across different forecast lead times

根据表5的数据,随着预报时效的增加,输入数据EC-Hres模式预报效果逐渐降低,但3D-QPF模型的表现相对稳定,在保持TS整体评分效果提升的同时,在累计降水量大于50 mm的灾害性降水预报中,24 h、48 h和72 h三种预报时效相较EC-Hres模式结果TS-50分别提升15.86%、5.88%和6.12%,与CMA模式预报相比TS-50分别提升61.53%、51.81%、57.58%.由于输入的EC-Hres模式预报中累计降水量大于50 mm的数据在整体中占比随着时效延长逐渐降低,使得模型预报更倾向于小量级降水,导致预报范围会随之缩小,在Bias-50上表现为数值逐渐变小.此外,3D-QPF模型降水量拟合的精细化(RMSE)上也表现出显著提升,在72 h预报时效中,本文模型预测结果较EC-Hres模式预报的RMSE减小18.71%,与CMA模式预报相比,RMSE下降了30.13%.
3.5 天气个例分析
为了更加直观和定量化地展示本研究所提出的3D-QPF模型较EC-Hres模式的优化效果,以24 h、48 h、72 h三种时效累计降水量进行个例对比分析,结果如图7和表6所示.
由图7a可以看到长江中下游区域、湖北北部地区及河南南部地区出现大规模强降雨事件.3D-QPF模型三种时效预测结果与标签预报结果(图7a)较为接近,而在EC-Hres模式预报中几乎未能大面积捕捉到极端暴雨事件.在72 h的预报时效中,3D-QPF模型预测结果中虽然暴雨区域覆盖不够完整,但总体趋势仍集中于湖北省北部地区,而在EC-Hres模式预报中将暴雨区域误报为主要集中在安徽南部区域.由表6可知,3D-QPF模型不仅在三种预报时效中TS-50的评分超EC-Hres模式,在降水量拟合精细化(RMSE)方面也有较大提升.
表62022年3月21日 24 h累积降水实况与三种时效降水预报效果评分比对
Table6Comparison of forecast performance between 3D-QPF and EC-Hres on 24-hour cumulative precipitation of March 21, 2022

从测试集中再次抽取个例暴雨天气情况进行数据详情比对分析,结果如表7所示.我国南部降水较多,存在较多局部暴雨情况,且易受台风等强对流天气影响,表7中共分析5个强对流过程,包括急流、台风、冷涡等典型强降水系统,本模型3D-QPF整体表现均优于EC-Hres模式预报效果,其中:2022年3月30日24 h预报时效TS-50提升达48.60%; 2022年9月3日24 h预报时效RMSE降低44.97%.在5个强对流过程中,24 h预报时效TS-50平均提升22.22%,RMSE平均优化15.99%.
图72022年3月21日 24 h累积降水实况与三种时效降水预报对比
Fig.7Comparison between actual and forecasted 24-hour cumulative precipitation on March 21, 2022
4 结论与讨论
本研究提出的3D-QPF模型是一种人工智能降水预报订正模型,基于传统U-Net架构,修改其内部结构和对损失函数进行调整,并采用先分级后细化的耦合方式,以提高降水(强降水)预报的准确性.实验结果表明:3D-QPF模型在短中期降水预报任务中表现出色,优于EC-Hres模式和CMA模式结果,与观测值的拟合度较高,且具有较高灵活性,可以根据用户需求使用不同时效数据进行自主训练,以实现多种时效的降水预报.但在预报任务的优化过程中有以下问题需着重关注:1)订正前的数据质量决定着模型基础性能,是决定最终效果的基石,对于自然条件下暴雨数据属于强偏态数据,需进行一定的预处理使得数据更符合正态分布才能保证模型有效性; 2)复杂的对流天气过程的演化不能仅仅依靠过去时刻已发生的单一数据进行时序推演,需要结合气象专家知识,选择相关性较高的气象要素作为信息补偿进行融合预报; 3)符合大气系统三维空间结构的数据建模,相较二维数据能够使得模型更好地理解天气现象的演化过程,其中地面因素和高空因素都很重要; 4)对于小样本事件的预测需要针对性地增加模型对该事件的关注度或是预报倾向; 5)算法的选择应与数据基础、预报对象、运行环境等相匹配,不存在永远为最优选择的方法.
表7多例降水评分对比结果
Table7Details of 3D-QPF outperforming EC-Hres on several precipitation forecasts

本研究方法虽弥补其他模型在捕获空间信息方面的不足,具备一定的订正能力,但在使用方法上较为单一.由于算力有限,未通过提取数据的语义信息对模型预报进行直接的信息补偿工作,只能利用气象要素间的相关性对模型进行间接优化,同时,在回归任务中非线性拟合能力还需进一步提高,尤其是对于大暴雨的拟合精确性,以更好地满足实际应用需求,尽可能减少极端天气带来的生命危险及财产损失.