基于双池化注意力机制的高光谱图像分类算法

陈栋，李明，李莉，陈淑文; CHEN Dong; LI Ming; LI Li; CHEN Shuwen

2025年5月20日 6:02 星期二

引 en

基于双池化注意力机制的高光谱图像分类算法

陈栋¹
机构：
1. 重庆师范大学计算机与信息科学学院,重庆， 401331
×
，李明¹
机构：
1. 重庆师范大学计算机与信息科学学院,重庆， 401331
×
，李莉²
机构：
2. 西南大学计算机与信息科学学院,重庆， 400715
×
，陈淑文³
机构：
3. 重庆师范大学数学科学学院,重庆， 401331
×

1. 重庆师范大学计算机与信息科学学院,重庆， 401331；
2. 西南大学计算机与信息科学学院,重庆， 400715；
3. 重庆师范大学数学科学学院,重庆， 401331；

Hyperspectral image classification based on double pool attention mechanism

CHEN Dong¹
Affiliation：
1. College of Computer and Information Science,Chongqing Normal University,Chongqing 401331
×
，LI Ming¹
Affiliation：
1. College of Computer and Information Science,Chongqing Normal University,Chongqing 401331
×
，LI Li²
Affiliation：
2. College of Computer and Information Science,Southwest University,Chongqing 400715
×
，CHEN Shuwen³
Affiliation：
3. School of Mathematical Sciences,Chongqing Normal University,Chongqing 401331
×

1. College of Computer and Information Science,Chongqing Normal University,Chongqing 401331；
2. College of Computer and Information Science,Southwest University,Chongqing 400715；
3. School of Mathematical Sciences,Chongqing Normal University,Chongqing 401331；

作者简介:

陈栋,男,硕士生,研究方向为深度学习、计算机视觉.1593056183@qq.com

通讯作者:

李明(通信作者),男,博士,教授,研究方向为机器学习、计算机视觉.20131052@cqnu.edu.cn

中图分类号:TP391.4

文献标识码:A

DOI:10.13878/j.cnki.jnuist.20220505003

全文
评论
参考文献
出版信息

参考文献 1

Melgani F,Bruzzone L.Classification of hyperspectral remote sensing images with support vector machines[J].IEEE Transactions on Geoscience and Remote Sensing,2004,42(8):1778-1790

查找原文

参考文献 2

Su H J,Cai Y,Du Q.Firefly-algorithm-inspired framework with band selection and extreme learning machine for hyperspectral image classification[J].IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing,2017,10(1):309-320

查找原文

参考文献 3

Chen Y,Nasrabadi N M,Tran T D.Hyperspectral image classification using dictionary-based sparse representation[J].IEEE Transactions on Geoscience and Remote Sensing,2011,49(10):3973-3985

查找原文

参考文献 4

Tu B,Wang J P,Kang X D,et al.KNN-based representation of superpixels for hyperspectral image classification[J].IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing,2018,11(11):4032-4047

查找原文

参考文献 5

郭文慧,曹飞龙.基于3D多尺度特征融合残差网络的高光谱图像分类[J].模式识别与人工智能,2019,32(10):882-891 GUO Wenhui,CAO Feilong.Hyperspectral image classification based on 3D multi-scale feature fusion residual network[J].Pattern Recognition and Artificial Intelligence,2019,32(10):882-891

查找原文

参考文献 6

谭潞聃.面向自然语言处理的深度学习模型优化研究[D].长沙:国防科技大学,2017 TAN Ludan.Research on optimization of deep learning model for natural language processing[D].Changsha:National University of Defense Technology,2017

查找原文

参考文献 7

王慧玲,綦小龙,武港山.基于深度卷积神经网络的目标检测技术的研究进展[J].计算机科学,2018,45(9):11-19 WANG Huiling,QI Xiaolong,WU Gangshan.Research progress of object detection technology based on convolutional neural network in deep learning[J].Computer Science,2018,45(9):11-19

查找原文

参考文献 8

Pan B,Shi Z W,Zhang N,et al.Hyperspectral image classification based on nonlinear spectral-spatial network[J].IEEE Geoscience and Remote Sensing Letters,2016,13(12):1782-1786

查找原文

参考文献 9

Chen Y S,Lin Z H,Zhao X,et al.Deep learning-based classification of hyperspectral data[J].IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing,2014,7(6):2094-2107

查找原文

参考文献 10

Yu S Q,Jia S,Xu C Y.Convolutional neural networks for hyperspectral image classification[J].Neurocomputing,2017,219:88-98

查找原文

参考文献 11

Chen Y S,Jiang H L,Li C Y,et al.Deep feature extraction and classification of hyperspectral images based on convolutional neural networks[J].IEEE Transactions on Geoscience and Remote Sensing,2016,54(10):6232-6251

查找原文

参考文献 12

Li Y,Zhang H K,Shen Q.Spectral-spatial classification of hyperspectral imagery with 3D convolutional neural network[J].Remote Sensing,2017,9(1):67

查找原文

参考文献 13

张建伟,陈允杰.高光谱图像分类方法综述[J].南京信息工程大学学报(自然科学版),2020,12(1):89-100 ZHANG Jianwei,CHEN Yunjie.Overview of hyperspectral image classification methods[J].Journal of Nanjing University of Information Science & Technology(Natural Science Edition),2020,12(1):89-100

查找原文

参考文献 14

Abend K,Harley T,Chandrasekaran B,et al.Comments on ‘On the mean accuracy of statistical pattern recognizers’ by Hughes,G.F.[J].IEEE Transactions on Information Theory,1969,15(3):420-423

查找原文

参考文献 15

He K M,Zhang X Y,Ren S Q,et al.Deep residual learning for image recognition[C]//2016 IEEE Conference on Computer Vision and Pattern Recognition.June 27-30,2016,Las Vegas,NV,USA.IEEE,2016:770-778

查找原文

参考文献 16

Zhong Z L,Li J,Luo Z M,et al.Spectral:spatial residual network for hyperspectral image classification:a 3-D deep learning framework[J].IEEE Transactions on Geoscience and Remote Sensing,2018,56(2):847-858

查找原文

参考文献 17

Huang G,Liu Z,van der Maaten L,et al.Densely connected convolutional networks[C]//2017 IEEE Conference on Computer Vision and Pattern Recognition.July 21-26,2017,Honolulu,HI,USA.IEEE,2017:2261-2269

查找原文

参考文献 18

Roy S K,Krishna G,Dubey S R,et al.HybridSN:exploring 3-D-2-D CNN feature hierarchy for hyperspectral image classification[J].IEEE Geoscience and Remote Sensing Letters,2020,17(2):277-281

查找原文

参考文献 19

Huang Z L,Wang X G,Huang L C,et al.CCNet:criss-cross attention for semantic segmentation[C]//2019 IEEE/CVF International Conference on Computer Vision(ICCV).October 27-November 2,2019,Seoul,Korea(South).IEEE,2019:603-612

查找原文

参考文献 20

Fu J,Liu J,Tian H J,et al.Dual attention network for scene segmentation[C]//2019 IEEE/CVF Conference on Computer Vision and Pattern Recognition(CVPR).June 15-20,2019,Long Beach,CA,USA.IEEE,2019:3141-3149

查找原文

参考文献 21

Song W W,Li S T,Fang L Y,et al.Hyperspectral image classification with deep feature fusion network[J].IEEE Transactions on Geoscience and Remote Sensing,2018,56(6):3173-3184

查找原文

参考文献 22

Alipour-Fard T,Paoletti M E,Haut J M,et al.Multibranch selective kernel networks for hyperspectral image classification[J].IEEE Geoscience and Remote Sensing Letters,2021,18(6):1089-1093

查找原文

参考文献 23

Hu J,Shen L,Sun G.Squeeze-and-excitation networks[C]//2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition.June 18-23,2018,Salt Lake City,UT,USA.IEEE,2018:7132-7141

查找原文

参考文献 24

Ma W P,Yang Q F,Wu Y,et al.Double-branch multi-attention mechanism network for hyperspectral image classification[J].Remote Sensing,2019,11(11):1307

查找原文

参考文献 25

Li R,Zheng S Y,Duan C X,et al.Classification of hyperspectral image based on double-branch dual-attention mechanism network[J].Remote Sensing,2020,12(3):582

查找原文

目录contents

摘要 Abstract
关键词 Keywords
0 引言
1 基于双池化注意力机制的分类方法
1.1 三维卷积
1.2 三维密集连接模块
1.3 双池化注意力机制模块
1.4 整体网络结构
2 对比实验结果与分析
2.1 数据集
2.2 各方法的实验结果对比
2.3 实验分析
2.3.1 输入数据空间尺寸
2.3.2 三维卷积密集连接数
2.3.3 DPAM中不同池化类型对分类精度OA的影响
3 结论
参考文献

摘要

为了提高高光谱图像在有限训练样本下的分类性能,提出了一种基于双池化注意力机制的高光谱图像分类网络(DPAMN)．首先,采用三维卷积提取高光谱图像的空间和光谱浅层信息．其次,为了增强网络的特征提取能力,在DPAMN中引入了一种双池化注意力机制．最后,在网络的深层引入三维卷积密集连接模块,该模块不仅能够充分提取高光谱图像的空间和光谱特征,同时还能提高特征的判别能力．实验结果表明,在Indian Pines、University of Pavia、Salinas以及Houston 2013数据集上分别取得95.45%、97.11%、95.30%以及93.71%的整体平均精度,与目前主流的已有先进方法相比,所提出的方法在4个数据集上均有较大提升,表明所提方法具有较强的泛化能力．

Abstract

In order to improve the classification performance of hyperspectral images with limited training samples,a hyperspectral image classification Network based on Double Pooling Attention Mechanism (DPAMN) is proposed in this paper.First,the DPAMN uses three-dimensional convolution to extract the spatial and spectral shallow information of hyperspectral images.Second,the double pooling attention mechanism is introduced into DPAMN to enhance the feature extraction ability of the network.Finally,the three-dimensional convolution dense connection module is introduced into the deep layer of the network,which can not only fully extract the spatial and spectral features of hyperspectral images,but also improve the ability of feature discrimination.Experiments show that the overall average accuracy of 95.45%,97.11%,95.30% and 93.71% can be achieved on datasets of Indian Pines,University of Pavia,Salinas and Houston 2013,respectively.Compared with the current mainstream advanced methods,the proposed method greatly improves classification performance on four datasets,indicating its strong generalization capacity.

关键词

卷积神经网络；高光谱图像；分类；注意力机制；空谱特征提取

Keywords

convolutional neural network (CNN) ； hyperspectral images ； classification ； attention mechanism ； spatial-spectral feature extraction

0 引言
高光谱图像包含丰富的空间和光谱信息．高光谱图像分类就是确定每个像素所属类别，且高光谱图像的分类精度将会影响后续的图像处理工作．在高光谱图像分类研究早期，很多表现出色的机器学习方法获得了较好的分类性能，包括支持向量机^[1]、极限学习机^[2]、基于稀疏表示^[3]以及K最近邻^[4]的方法．由于研究早期基于机器学习的分类网络均为浅层网络，这种网络不足以提取高光谱图像的复杂特征．
近年来，基于深度学习的方法由于其强大的特征处理能力在计算机视觉包括自然语言处理、图像处理以及目标检测领域获得了优异的成绩^[5-8]．Chen等^[9]提出一种堆叠式自动编码器，基于分层思想提取空间和光谱特征．Yu等^[10]提出一种基于卷积神经网络（CNN）的高光谱图像分类方法，通过卷积层合理的卷积滤波器和池化层提取不同层的光谱和空间特征，经多层提取的特征获得了较好的实验结果．为了更充分地提取空间和光谱特征，Chen等^[11]提出一种基于端到端二维卷积神经网络（2DCNN）的高光谱图像分类方法．特别地，高光谱图像自身具备三维数据属性，在对高光谱图像进行处理的过程中，往往将其看作三维数据．因此，Li等^[12]提出一种基于三维卷积神经网络（3DCNN）的高光谱图像分类方法，并提高了类间可分性．值得注意的是，为了改善高光谱图像的分类性能，张建伟等^[13]对众多的空间光谱联合分类方法进行了归类和分析．
在深度学习框架中，基于CNN的网络框架得到广泛的应用．虽然基于CNN的深度学习方法相比于传统的机器学习方法能够较大地改善分类性能，但随着CNN网络的深度逐渐加大，将会出现休斯现象（Hughes）^[14]和网络退化．为了避免这些现象的发生，He等^[15]提出一种残差网络（ResNet），能够有效解决由于网络加深带来的退化问题．该网络通过跳线连接将浅层的特征恒等映射到深层特征，且这种跳线连接并不会带来额外的参数和计算复杂度．为了改善高光谱图像的分类性能，Zhong等^[16]设计了空间残差模块和光谱残差模块来提取图像的空间特征和光谱特征（SSRN），且获得了较好的分类精度，这进一步表明残差结构在高光谱图像分类任务中的有效性．为了加强层与层之间的信息流动性，Huang等^[17]提出一种密集连接网络（DenseNet），一定程度上缓解了梯度消失问题．Roy等^[18]结合3 DCNN和2DCNN，提出一种混合结构（HybridSN）．虽然以上方法在数据样本充足的情况下能够获得较为不错的分类精度，但在小样本下得到的分类性能依然较差．
受人类视觉的启发，一种注意力机制模块被提出，该注意力机制有利于进一步提高分类性能^[19-23]．高光谱图像包含空间和光谱特征，而三维卷积神经网络是同时对图像提取空间和光谱特征．为了避免提取的空间特征和光谱特征相互干扰，Ma等^[24]提出一种双分支多注意力机制网络（DBMA），并在小训练样本下获得了较好的分类精度．为了进一步改善分类性能，Li等^[25]提出一种DBMA的改进网络DBDA，实验结果验证了该网络在小训练样本下的有效性．
然而，实际应用中高光谱图像已知类别的样本依然是十分有限的，还需更加充分地提取高光谱图像的空间和光谱特征，进而获得更优异的分类性能．有鉴于此，本文提出一种基于双池化注意力机制的高光谱图像分类网络（DPAMN）．实验结果表明，本文方法在有限训练样本情况下能够获得较好的分类效果．
本文的贡献主要如下:
1）本文提出一种基于双池化注意力机制网络，用来强调通道之间的相互关系．具体地说，使用全局最大池化和全局平均池化来聚集图像的重要信息，且使用自适应卷积增强通道之间的表示能力．
2）为了缓解梯度消失和梯度退化问题，本文提出一种三维密集连接模块，通过该模块能够提取丰富的特征，且避免了信息的丢失．
3）所提出的双池化注意力机制网络结合了注意力机制模块和3DCNN密集连接模块．注意力机制模块被用来增强重要的信息，且抑制了无用的信息．使用3DCNN密集连接模块充分提取图像的光谱-空间联合信息．
1 基于双池化注意力机制的分类方法
1.1 三维卷积
由于高光谱图像自身数据属性，三维卷积神经网络（3DCNN）比二维卷积神经网络（2DCNN）在高光谱图像分类领域应用更加广泛．此外，2DCNN在提取高光谱图像的空间和光谱过程中会导致像素之间的相关性被破坏，而3DCNN能够更好地保护图像的空间信息，避免造成信息丢失．
图1表示三维卷积过程，输入特征大小为 $X \in R^{H \times W \times L}$ （其中，H表示特征图的高度，W表示特征图的宽度，L表示特征图的波段数量），卷积核大小为h×w×l．为保证输出和输入的大小相同，采用的填充操作属性值为SAME，则经过卷积的输出为

v_{i j}^{s j z} = f (\sum_{m} \sum_{p = 0}^{h_{i} - 1} \sum_{q = 0}^{w_{i} - 1} \sum_{r = 0}^{b_{i} - 1} k_{i j m}^{p q r} v_{(i - 1) m}^{(x + p) (y + q) (z + r)} + b_{i j}),

(1)

式中:i表示的是第i层; $v_{i j}^{x y z}$ 表示第i层的第j个特征图在（x，y，z）位置上的输出; m表示第i层的神经元个数; $k_{i j m}^{β p r}$ 表示第m个特征图中（p，q，r）的权重; b_ij表示卷积层的偏置项; f（·）表示激活函数; h_i，w_i，b_i分别表示第i层中卷积核高度、宽度以及长度．
图1 三维卷积
Fig.1 Three dimensional convolution
1.2 三维密集连接模块
随着网络层数的增加，分类性能可以有效改善，但随着网络逐渐变深，会出现梯度消失和模型退化问题．为此，本设计的分类网络中引入了三维密集连接模块，其结构如图2所示．可以看出，输入通过4个Conv+BN+ReLU组合层输出，且每个组合层之间通过跳线连接，设置旁路使得深层特征与浅层特征有效流动．引入三维密集连接模块能够在一定程度上缓解梯度消失和模型退化问题．
图2 三维密集连接模块结构
Fig.2 Structure of 3D dense connection module
三维密集连接模块主要包括4个组合层，层与层之间相互连接．其中，每一个组合层包括Conv+BN+ReLU．具体地说，输入 $X \in R^{H \times W \times L}$ 经过三维Conv层的输出为

Y = W * X + b,

(2)

其中: $Y \in R^{H \times W \times L}$ 为卷积后的输出; W为三维卷积的权重; b为三维卷积的偏置项．为了加快收敛速度并避免过拟合现象的发生，将三维卷积的输出经过归一化BN层，即:

{\hat{x}}^{(i)} = \frac{x^{(i)} - E [x^{(i)}]}{\sqrt{D [x^{(i)}]}}

(3)

式中:E[x^（ⁱ^）]表示所有神经元值的平均值; $\sqrt{D [x^{（ i ）}]}$ 表示所有神经元输入值的标准差; x表示归一化BN层的输入．为了使得稀疏后的模型能够更好地挖掘相关特征、拟合训练数据，在归一化之后接入ReLU激活函数层，即:

g (x) = \{\begin{matrix} x, x > 0 \\ 0, x ⩽ 0 \end{matrix}

(4)

式中，x表示非线性激活函数的输入，g（·）表示非线性激活函数．
从三维密集连接模块可以看出，层与层之间通过跳线连接．第i层的输入等于前面所有i-1的输出之和．即:

x_{l} = H_{l} [x_{0}, x_{1}, \dots, x_{l - 1}],

(5)

其中，H_l[·]表示第i层的系统函数，包括三维卷积层、归一化BN层以及ReLU非线性激活层．假设输入特征图的输入大小为H×W×L，且有2C个通道，每个卷积层为C个大小为1×1×d的卷积核，则输入经过该卷积层的输出为C个大小为H×W×L的特征图．而特征图的输出通道数和输入通道数存在密集连接关系:

C_{m} = 2 C + (m - 1) C,

(6)

式中，C_m表示第m层输出的通道数量．
1.3 双池化注意力机制模块
在高光谱图像中空间像素间相互依赖关系有利于更准确地实现像素分类．近年来，很多注意力机制被相继提出，用来探索空间的依赖关系．为了进一步强调更重要的特征，抑制无用的特征，本文提出一种双池化注意力机制，结构如图3所示．考虑到不同通道的空间信息压缩和通道相关性，且所携带的信息不同，仅使用平均池化或者最大池化，会使得图像一部分信息丢失．为了得到更多的信息，本文采用平均池化层和最大池化层同时进行池化操作来提取所有通道的最大特征值和平均特征值，最后将得到的特征进行融合．具体地说，假设输入为C个 $x \in R^{H \times W \times L}$ ，经过平均池化和最大池化后的输出大小为C个 $x^{'} \in R^{1 \times 1 \times 1}$ ．而此时每个通道均为一个元素，并且不同元素的值代表着对应通道的信息．
图3 双池化注意力机制结构
Fig.3 Structure of double pooling attention mechanism
将融合后得到的结果再经过自适应卷积层，且自适应核大小k与通道C相关．从卷积的跨通道交互角度来看，C与长期交互作用呈正相关．即C越大，长期交互关系越强; 反之，C越小，短期交互关系越强．而自适应核大小k与通道C关系：

k = ϕ (C),

(7)

式中， $ϕ$ （·）为自适应核函数．同样地，为了使得稀疏后的模型能够更好地挖掘相关特征，将经过自适应卷积后的输出经过ReLU非线性激活函数层得到注意力图．最后，将所得到的注意力图与原始输入进行点积操作得到最终的输出．
1.4 整体网络结构
针对高光谱图像的高维特性以及样本数据量有限的情况，本文设计了一个双池化注意力机制网络（DPAMN）．DPAMN的整体结构如图4所示．网络包括浅层特征提取、双池化注意力机制模块（DPAM）以及三维密集连接模块组成．
原始高光谱图像经过浅层网络获得具体的特征，再经过DPAM层将重要的特征进行强化，且抑制无用的特征．将所得到的结果经过三维密集连接模块进行深层特征提取，得到更加抽象的语义信息，最后将得到的特征向量经过概率分布确定所属类别．为了更加详细地表示DPAMN网络，以Indian Pines数据为例，该数据集的图像大小为145×145×200，表1给出了DPAMN各层的卷积核大小和该层的输出尺寸大小．特别地，若3D卷积使用的卷积核较大，则将会使得网络的参数激增．因此，本文在3D密集连接模块中所采用卷积核大小为3×3×11．
图4 DPAMN的整体结构
Fig.4 Overall structure of DPAMN
表1 DPAMN的各层参数设置
Table1 Parameter setting for each layer of DPAMN
2 对比实验结果与分析
为了验证所提出方法的有效性，选择Indian Pines、University of Pavia、Salinas以及Houston 2013 4种数据集，且进行一系列实验．本节将给出所有对比实验的结果和分析．此外，为了公平比较，所有的实验均在处于相同的实验环境并且配置相同的实验参数．实验所使用的硬件平台是Intel（R）Core（TM）i7-9750H CPU、NVIDA GeForce GTX1060 TI GPU和8 GB的内存．软件环境是CUDA 10.0、pytorch 1.2.0和python 3.7.4．实验采用总体分类精度（Over-all Accuracy，OA）、平均分类精度（Average Accuracy，AA）、Kappa系数3个衡量指标来评价所有的方法．
2.1 数据集
本实验采用的数据集包括Indian Pines、University of Pavia、Salinas以及Houston 2013 4种常见数据集．在实验过程中，4种数据集分别随机选取5%、1%、1%以及2%样本比例作为训练样本．
1）Indian Pines数据集的空间大小为145×145，拥有220个波段，但除去吸水带20个，剩下200个波段用于实验中．同样地，除去背景像素，用于实验的空间像素有10 249个．该数据集有16个覆盖地物类别，具体类别信息见表2．
表2 Indian Pines的类别信息
Table2 Category information of Indian Pines dataset
2）University of Pavia数据集由反射光学系统成像光谱仪（ROSIS）捕获而来，其空间大小为610×340，空间分辨率为1.3 m，但仅有103个波段可用于实验．该数据集有9个地物覆盖类别，具体类别信息见表3．
3）Salinas数据集是1996年通过AVIRIS传感器获取的，空间大小为512×614，有176个可用波段．该数据集有16个地物覆盖类别，具体类别信息见表4．
4）Houston 2013数据集由紧凑型机载光谱成像仪（CASI）传感器获取，其空间大小为349×1 905，波段数为114，波长范围为380~1 050 nm．该数据集包含15个地物覆盖类别，具体类别信息见表5．
表3 University of Pavia数据集的类别信息
Table3 Category information of University of Pavia dataset
表4 Salinas数据集的类别信息
Table4 Category information of Salinas dataset
2.2 各方法的实验结果对比
为了更好体现所提出方法的优越性，本节将DPAMN与多种深度学习方法相比较，包括SSRN^[16]、DBMA^[24]、DBDA^[25]、HybridSN^[18]．所有参数设置均相同．选择的空间输入大小为9×9．
表5 Houston 2013数据集的类别信息
Table5 Category information of Houston 2013dataset
SSRN包含空间残差模块和光谱残差模块，一定程度上缓解了网络梯度消失的问题．DBMA与DBDA是一个双分支结构，并且在空间分支和光谱分支分别引入空间注意力和光谱注意力．HybridSN将3DCNN和2DCNN结合起来，利用3DCNN来提取高光谱图像的空间和光谱特征，且利用2DCNN来提取空间特征．表6—9和图5—8给出了不同方法在Indian Pines、University of Pavia、Salinas以及Houston 2013数据集上的所有分类结果．
由于Indian Pines的类间混合程度较大，且类别较多，现阶段很多方法的分类精度都不是很好．从表6可以看出，所有方法的分类精度较低．然而，与其他方法相比，本文方法获得最高的OA、AA和Kappa．不同方法在Indian Pines数据集上的所有分类如图5所示．通过比较，可以发现其他方法类间混合程度更高，错误分类较多，分类最差的是HybridSN．而本文方法得到结果更接近土地覆盖真实分类．虽然University of Pavia数据集的光谱波段比Indian Pines数据集少，但是不同方法获得分类精度却比Indian Pines数据集上得到的精度普遍要高（表7），这主要由于University of Pavia数据集的分类类别较少，仅有9类．
图6给出了不同方法在University of Pavia数据集上的分类结果，可以看到本文方法的分类图更加平滑，表明具备很好的分类判决能力．Salinas数据集土地覆盖更加规律，而Houston 2013数据集的空间分辨率更高．由表8和表9可知，DPAMN在Salinas和Houston 2013数据集上依然获得了最高的分类精度．图7与图8分别给出了所有方法在Salinas和Houston 2013数据集上的分类结果．可以发现，DPAMN方法在Salinas和Houston 2013数据集上的分类图更接近土地覆盖真实分类图，而DBDA方法虽然能够获得次优的分类图，但依然存在较多的错误分类．
表6 训练样本比例为5% Indian Pines数据集的分类精度
Table6 Classification accuracies of Indian Pines dataset with 5% training samples
表7 训练样本比例为1% University of Pavia数据集的分类精度
Table7 Classification accuracies of University of Pavia dataset with 1% training samples
图5 不同方法在 Indian Pines 数据集上的分类结果
Fig.5 Classification results of different methods on Indian Pines dataset
图6 不同方法在 University of Pavia 数据集上的分类结果
Fig.6 Classification results of different methods on University of Pavia dataset
表8 训练样本比例为1% Salinas数据集的分类精度
Table8 Classification accuracies of Salinas dataset with training sample ratio of 1%
表9 训练样本比例为2% Houston 2013数据集的分类精度
Table9 Classification accuracies of Houston 2013 dataset with training sample ratio of 2%
图7 不同方法在 Salinas 数据集上的分类结果
Fig.7 Classification results of different methods on Salinas dataset
因此，与其他先进方法相比，本文所提出方法获得最高的分类精度和最好的分类图，充分验证了本文方法的有效性．
2.3 实验分析
为了更好地体现本文提出的网络结构，下面对DPAMN输入空间大小、三维卷积密集连接个数以DPAM中不同池化类型对分类精度OA的影响进行定量分析．
2.3.1 输入数据空间尺寸
网络通过将原始图像切割成多个H×W×B的输入小图像块作为图像的输入．输入空间大小以5×5、7×7、9×9以及11×11为例．图9给出了DPAMN在Indian Pines、University of Pavia、Salinas以及Houston 2013 4个常见数据集上不同输入尺寸获得的OA值．可以看出，Indian Pines、University of Pavia和Salinas数据集中9×9获得的OA最高，11×11的输入空间大小获得的结果次之．在Indian Pines、University of Pavia以及Salinas数据集上OA值随着空间输入增大先增大后减小，而Houston 2013数据集上OA值随着空间输入增大逐渐增大，最优的输入空间大小为11×11．因此，对比实验采用9×9的空间输入大小输入到网络中．
图8 不同方法在 Houston 2013 数据集上的分类结果
Fig.8 Classification results of different methods on Houston 2013 dataset
图9 不同数据集中不同输入尺寸的OA值
Fig.9 OA values of different input sizes on different datasets
2.3.2 三维卷积密集连接数
本文采用三维卷积密连接模块来增强网络的空间和光谱特征提取能力，三维卷积密连接模块中密集连接个数越多提取的特征越抽象．因此，本节将对三维卷积密集连接个数对网络分类精度的影响进行讨论．本文设置一个密集连接个数为1的对比实验，且以3、4、5、6个三维卷积密集连接个数作为实验组．图10给出了不同密集连接个数在不同数据集上的分类精度OA值．可以看出，采用密集连接模块能够有效地提高网络的分类精度．5个和6个卷积密集连接个数获得结果相似，但在Salinas数据集上，5个卷积密集连接个数的OA值远远超过6个卷积密集连接个数模块的OA值．此外，6个卷积组成的模块参数量也超过5个卷积组成的密集连接模块．因此，本文设计的DPAMN中的三维密集连接模块采用的三维卷积个数为5个．
图10 不同密集连接个数在不同数据集上对分类精度OA的影响
Fig.10 Effect of dense connection numbers on classification OA on different datasets
2.3.3 DPAM中不同池化类型对分类精度OA的影响
在所提出的DPAMN中，设计的DPAM采用最大池化层和平均池化层共同计算信息映射．最大池化操作生成了在局部区域中值最大的显著图，平均池化层计算局部区域的平均值来表示特征图的关键信息．从表10中可以看出:单独采用最大池化层或者单独采用平均池化层，均会导致图像的信息丢失，获得的结果在4个数据集上表现相近; 当最大池化层和平均池化层同时使用时（双池化）聚合性能最好，获得的OA值在4个数据集上均为最高．此外，本文在双池化之后引入了自适应卷积，充分挖掘了通道之间的相关性．因此，通过消融实验，充分验证了本文提出的双池化注意力机制的有效性．
表10 DPAM中不同池化类型对分类精度OA的影响
Table10 Effect of pooling types on classification OA in DPAM
3 结论
1）本文设计的基于双池化注意力机制分类网络，提出一种双池化注意力机制来强调通道之间的相互关系，并在深层网络中引入三维连接模块，不仅充分提取了深层空间和光谱的特征，还在一定程度上缓解了梯度消失问题和网络退化问题，在小训练样本情况下提高了分类精度．
2）本文通过实验分析不同的网络参数对分类性能的影响，找到了最优的网络参数设置，并与现阶段高光谱图像分类最先进的方法相比．实验结果表明，本文所提方法在小样本下具有更好的分类性能．
未来的研究工作当中，将继续在极小样本的情况下探究更强大的特征提取网络，且利用残差模块构建更优的网络．
参考文献
- [1] Melgani F,Bruzzone L.Classification of hyperspectral remote sensing images with support vector machines[J].IEEE Transactions on Geoscience and Remote Sensing,2004,42(8):1778-1790
- [2] Su H J,Cai Y,Du Q.Firefly-algorithm-inspired framework with band selection and extreme learning machine for hyperspectral image classification[J].IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing,2017,10(1):309-320
- [3] Chen Y,Nasrabadi N M,Tran T D.Hyperspectral image classification using dictionary-based sparse representation[J].IEEE Transactions on Geoscience and Remote Sensing,2011,49(10):3973-3985
- [4] Tu B,Wang J P,Kang X D,et al.KNN-based representation of superpixels for hyperspectral image classification[J].IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing,2018,11(11):4032-4047
- [5] 郭文慧,曹飞龙.基于3D多尺度特征融合残差网络的高光谱图像分类[J].模式识别与人工智能,2019,32(10):882-891 GUO Wenhui,CAO Feilong.Hyperspectral image classification based on 3D multi-scale feature fusion residual network[J].Pattern Recognition and Artificial Intelligence,2019,32(10):882-891
- [6] 谭潞聃.面向自然语言处理的深度学习模型优化研究[D].长沙:国防科技大学,2017 TAN Ludan.Research on optimization of deep learning model for natural language processing[D].Changsha:National University of Defense Technology,2017
- [7] 王慧玲,綦小龙,武港山.基于深度卷积神经网络的目标检测技术的研究进展[J].计算机科学,2018,45(9):11-19 WANG Huiling,QI Xiaolong,WU Gangshan.Research progress of object detection technology based on convolutional neural network in deep learning[J].Computer Science,2018,45(9):11-19
- [8] Pan B,Shi Z W,Zhang N,et al.Hyperspectral image classification based on nonlinear spectral-spatial network[J].IEEE Geoscience and Remote Sensing Letters,2016,13(12):1782-1786
- [9] Chen Y S,Lin Z H,Zhao X,et al.Deep learning-based classification of hyperspectral data[J].IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing,2014,7(6):2094-2107
- [10] Yu S Q,Jia S,Xu C Y.Convolutional neural networks for hyperspectral image classification[J].Neurocomputing,2017,219:88-98
- [11] Chen Y S,Jiang H L,Li C Y,et al.Deep feature extraction and classification of hyperspectral images based on convolutional neural networks[J].IEEE Transactions on Geoscience and Remote Sensing,2016,54(10):6232-6251
- [12] Li Y,Zhang H K,Shen Q.Spectral-spatial classification of hyperspectral imagery with 3D convolutional neural network[J].Remote Sensing,2017,9(1):67
- [13] 张建伟,陈允杰.高光谱图像分类方法综述[J].南京信息工程大学学报(自然科学版),2020,12(1):89-100 ZHANG Jianwei,CHEN Yunjie.Overview of hyperspectral image classification methods[J].Journal of Nanjing University of Information Science & Technology(Natural Science Edition),2020,12(1):89-100
- [14] Abend K,Harley T,Chandrasekaran B,et al.Comments on ‘On the mean accuracy of statistical pattern recognizers’ by Hughes,G.F.[J].IEEE Transactions on Information Theory,1969,15(3):420-423
- [15] He K M,Zhang X Y,Ren S Q,et al.Deep residual learning for image recognition[C]//2016 IEEE Conference on Computer Vision and Pattern Recognition.June 27-30,2016,Las Vegas,NV,USA.IEEE,2016:770-778
- [16] Zhong Z L,Li J,Luo Z M,et al.Spectral:spatial residual network for hyperspectral image classification:a 3-D deep learning framework[J].IEEE Transactions on Geoscience and Remote Sensing,2018,56(2):847-858
- [17] Huang G,Liu Z,van der Maaten L,et al.Densely connected convolutional networks[C]//2017 IEEE Conference on Computer Vision and Pattern Recognition.July 21-26,2017,Honolulu,HI,USA.IEEE,2017:2261-2269
- [18] Roy S K,Krishna G,Dubey S R,et al.HybridSN:exploring 3-D-2-D CNN feature hierarchy for hyperspectral image classification[J].IEEE Geoscience and Remote Sensing Letters,2020,17(2):277-281
- [19] Huang Z L,Wang X G,Huang L C,et al.CCNet:criss-cross attention for semantic segmentation[C]//2019 IEEE/CVF International Conference on Computer Vision(ICCV).October 27-November 2,2019,Seoul,Korea(South).IEEE,2019:603-612
- [20] Fu J,Liu J,Tian H J,et al.Dual attention network for scene segmentation[C]//2019 IEEE/CVF Conference on Computer Vision and Pattern Recognition(CVPR).June 15-20,2019,Long Beach,CA,USA.IEEE,2019:3141-3149
- [21] Song W W,Li S T,Fang L Y,et al.Hyperspectral image classification with deep feature fusion network[J].IEEE Transactions on Geoscience and Remote Sensing,2018,56(6):3173-3184
- [22] Alipour-Fard T,Paoletti M E,Haut J M,et al.Multibranch selective kernel networks for hyperspectral image classification[J].IEEE Geoscience and Remote Sensing Letters,2021,18(6):1089-1093
- [23] Hu J,Shen L,Sun G.Squeeze-and-excitation networks[C]//2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition.June 18-23,2018,Salt Lake City,UT,USA.IEEE,2018:7132-7141
- [24] Ma W P,Yang Q F,Wu Y,et al.Double-branch multi-attention mechanism network for hyperspectral image classification[J].Remote Sensing,2019,11(11):1307
- [25] Li R,Zheng S Y,Duan C X,et al.Classification of hyperspectral image based on double-branch dual-attention mechanism network[J].Remote Sensing,2020,12(3):582

基本信息

中图分类号: TP391.4
文献标识码: A
DOI: 10.13878/j.cnki.jnuist.20220505003

基金信息

国家自然科学基金(61877051,61170192)；
重庆市科委重点项目(cstc2017zdcy-zdyf0366)；
重庆市教委项目(113143)；
重庆市研究生教改重点项目(yjg182022)；

引用信息

稿件历史

收稿日期: 2022-05-05

参考文献

[1] Melgani F,Bruzzone L.Classification of hyperspectral remote sensing images with support vector machines[J].IEEE Transactions on Geoscience and Remote Sensing,2004,42(8):1778-1790
[2] Su H J,Cai Y,Du Q.Firefly-algorithm-inspired framework with band selection and extreme learning machine for hyperspectral image classification[J].IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing,2017,10(1):309-320
[3] Chen Y,Nasrabadi N M,Tran T D.Hyperspectral image classification using dictionary-based sparse representation[J].IEEE Transactions on Geoscience and Remote Sensing,2011,49(10):3973-3985
[4] Tu B,Wang J P,Kang X D,et al.KNN-based representation of superpixels for hyperspectral image classification[J].IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing,2018,11(11):4032-4047
[5] 郭文慧,曹飞龙.基于3D多尺度特征融合残差网络的高光谱图像分类[J].模式识别与人工智能,2019,32(10):882-891 GUO Wenhui,CAO Feilong.Hyperspectral image classification based on 3D multi-scale feature fusion residual network[J].Pattern Recognition and Artificial Intelligence,2019,32(10):882-891
[6] 谭潞聃.面向自然语言处理的深度学习模型优化研究[D].长沙:国防科技大学,2017 TAN Ludan.Research on optimization of deep learning model for natural language processing[D].Changsha:National University of Defense Technology,2017
[7] 王慧玲,綦小龙,武港山.基于深度卷积神经网络的目标检测技术的研究进展[J].计算机科学,2018,45(9):11-19 WANG Huiling,QI Xiaolong,WU Gangshan.Research progress of object detection technology based on convolutional neural network in deep learning[J].Computer Science,2018,45(9):11-19
[8] Pan B,Shi Z W,Zhang N,et al.Hyperspectral image classification based on nonlinear spectral-spatial network[J].IEEE Geoscience and Remote Sensing Letters,2016,13(12):1782-1786
[9] Chen Y S,Lin Z H,Zhao X,et al.Deep learning-based classification of hyperspectral data[J].IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing,2014,7(6):2094-2107
[10] Yu S Q,Jia S,Xu C Y.Convolutional neural networks for hyperspectral image classification[J].Neurocomputing,2017,219:88-98
[11] Chen Y S,Jiang H L,Li C Y,et al.Deep feature extraction and classification of hyperspectral images based on convolutional neural networks[J].IEEE Transactions on Geoscience and Remote Sensing,2016,54(10):6232-6251
[12] Li Y,Zhang H K,Shen Q.Spectral-spatial classification of hyperspectral imagery with 3D convolutional neural network[J].Remote Sensing,2017,9(1):67
[13] 张建伟,陈允杰.高光谱图像分类方法综述[J].南京信息工程大学学报(自然科学版),2020,12(1):89-100 ZHANG Jianwei,CHEN Yunjie.Overview of hyperspectral image classification methods[J].Journal of Nanjing University of Information Science & Technology(Natural Science Edition),2020,12(1):89-100
[14] Abend K,Harley T,Chandrasekaran B,et al.Comments on ‘On the mean accuracy of statistical pattern recognizers’ by Hughes,G.F.[J].IEEE Transactions on Information Theory,1969,15(3):420-423
[15] He K M,Zhang X Y,Ren S Q,et al.Deep residual learning for image recognition[C]//2016 IEEE Conference on Computer Vision and Pattern Recognition.June 27-30,2016,Las Vegas,NV,USA.IEEE,2016:770-778
[16] Zhong Z L,Li J,Luo Z M,et al.Spectral:spatial residual network for hyperspectral image classification:a 3-D deep learning framework[J].IEEE Transactions on Geoscience and Remote Sensing,2018,56(2):847-858
[17] Huang G,Liu Z,van der Maaten L,et al.Densely connected convolutional networks[C]//2017 IEEE Conference on Computer Vision and Pattern Recognition.July 21-26,2017,Honolulu,HI,USA.IEEE,2017:2261-2269
[18] Roy S K,Krishna G,Dubey S R,et al.HybridSN:exploring 3-D-2-D CNN feature hierarchy for hyperspectral image classification[J].IEEE Geoscience and Remote Sensing Letters,2020,17(2):277-281
[19] Huang Z L,Wang X G,Huang L C,et al.CCNet:criss-cross attention for semantic segmentation[C]//2019 IEEE/CVF International Conference on Computer Vision(ICCV).October 27-November 2,2019,Seoul,Korea(South).IEEE,2019:603-612
[20] Fu J,Liu J,Tian H J,et al.Dual attention network for scene segmentation[C]//2019 IEEE/CVF Conference on Computer Vision and Pattern Recognition(CVPR).June 15-20,2019,Long Beach,CA,USA.IEEE,2019:3141-3149
[21] Song W W,Li S T,Fang L Y,et al.Hyperspectral image classification with deep feature fusion network[J].IEEE Transactions on Geoscience and Remote Sensing,2018,56(6):3173-3184
[22] Alipour-Fard T,Paoletti M E,Haut J M,et al.Multibranch selective kernel networks for hyperspectral image classification[J].IEEE Geoscience and Remote Sensing Letters,2021,18(6):1089-1093
[23] Hu J,Shen L,Sun G.Squeeze-and-excitation networks[C]//2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition.June 18-23,2018,Salt Lake City,UT,USA.IEEE,2018:7132-7141
[24] Ma W P,Yang Q F,Wu Y,et al.Double-branch multi-attention mechanism network for hyperspectral image classification[J].Remote Sensing,2019,11(11):1307
[25] Li R,Zheng S Y,Duan C X,et al.Classification of hyperspectral image based on double-branch dual-attention mechanism network[J].Remote Sensing,2020,12(3):582

地址：江苏省南京市宁六路219号邮编：210044

联系电话：025-58731025 E-mail：nxdxb@nuist.edu.cn

分享给微信好友或者朋友圈

使用微信“扫一扫”功能。

基于双池化注意力机制的高光谱图像分类算法

Hyperspectral image classification based on double pool attention mechanism

摘要

Abstract

关键词

Keywords

0 引言

1 基于双池化注意力机制的分类方法

1.1 三维卷积

(1)

1.2 三维密集连接模块

(2)

(3)

(4)

(5)

(6)

1.3 双池化注意力机制模块

(7)

1.4 整体网络结构

2 对比实验结果与分析

2.1 数据集

2.2 各方法的实验结果对比

2.3 实验分析

2.3.1 输入数据空间尺寸

2.3.2 三维卷积密集连接数

2.3.3 DPAM中不同池化类型对分类精度OA的影响

3 结论

参考文献

基本信息

基金信息

引用信息

稿件历史

参考文献