摘要
考虑到变电站噪声的频谱特点,针对自适应算法存在收敛速度慢、跟踪能力弱和运算量大的缺陷,研究了一种改进生成式固定滤波器有源噪声控制(Enhanced Generative Fixed-Filter Active Noise Control,EGFANC)方法.采用轻量级的一维卷积神经网络(1-Dimensional Convolutional Neural Network,1D CNN)根据噪声帧信息输出权重向量后与子控制滤波器组合,以自适应地生成适用于各种噪声的控制滤波器.仿真结果表明,EGFANC方法在处理动态噪声和变压器谐波噪声时具有更好的降噪性能和鲁棒性,同时,EGFANC为不同类型噪声选择适当的预训练控制滤波器,可以显著减少收敛时间.
Abstract
Considering the spectral characteristics of substation noise,an Enhanced Generative Fixed-Filter Active Noise Control (EGFANC) approach is introduced to address the problems of slow convergence speed,weak tracking capability,and large computational complexity that perplexed adaptive algorithms.A lightweight one-Dimensional Convolutional Neural Network (1D CNN) is employed to output the weight vector based on noise frame information,then the weight vector is combined with sub-control filters to adaptively generate suitable control filters for various types of noise.The simulation results demonstrate that the EGFANC approach has superior noise reduction performance and robustness when dealing with dynamic noise and transformer harmonic noise.In addition,the proposed EGFANC approach can significantly reduce convergence time by selecting appropriate pre-trained control filters for different types of noise.
0 引言
随着城市化进程的加速,城市居民区变电站的噪声问题越来越受到关注.变电站噪声不仅影响居民的生活质量,还对人们的健康产生负面影响.因此,对其进行治理已成为当务之急[1].无源噪声控制通过利用特定的物理材料或结构以消耗声能的方式实现降噪,在中高频噪声的抑制上表现良好[2],但其处理低频噪声的能力有限.有源噪声控制(Active Noise Control,ANC)基于声波干涉原理,通过生成一个与初级噪声相位相反、幅度相等的次级信号来抵消初级噪声,进而实现降噪[3-5],其对低频噪声降噪效率高,近年来已在汽车、耳机、头枕等多种场景得到了应用[6-9].
滤波-x最小均方(Filtered-x Least Mean Square,FxLMS)算法是ANC中广泛使用的一类自适应算法[10],然而,由于自适应算法有限的收敛速度和跟踪能力,在处理快速变化或非平稳噪声时表现不佳[11].另一方面,对于变电站噪声控制需要采用多通道有源噪声控制系统,如陶建成等[12]采用15通道的系统组成声屏障.但多通道FxLMS算法运算量大,增加了系统硬件成本.为了提高响应速度和降低系统成本,固定控制滤波器ANC方法成为一种选择,如Shi等[13]提出一种基于频带匹配的选择性固定滤波器有源噪声控制(Selective Fixed-Filter Active Noise Control,SFANC)方法.然而,该方法的关键参数只能通过反复试验来确定,这限制了其在实际应用中的适用性.最近,神经网络在ANC中的应用引起了重视,如吴礼福等[14]尝试了双解码卷积循环网络用于风噪声有源控制,Shi等[15]将卷积神经网络(CNN)集成到SFANC方法中,以实现所有参数均从噪声数据集中自动学习.然而,由于SFANC方法中预先训练的控制滤波器数量有限,当某些噪声与滤波器训练噪声存在显著差异时,其噪声控制性能较差.
变压器噪声是变电站噪声中的重要成分,其频谱分布较为稳定.基于该特点,本文研究了一种改进生成式固定滤波器主动噪声控制(Enhanced Generative Fixed-Filter Active Noise Control,EGFANC)方法.首先,基于滤波器完美重构理论[16],将预训练的宽带控制滤波器分解为多个子控制滤波器.其次,采用轻量级的一维卷积神经网络(1-Dimensional Convolutional Neural Network,1D CNN)自动为初级噪声提供子控制滤波器的组合权重.随后,通过对子控制滤波器进行加权求和,生成所需的控制滤波器,用于实时的噪声控制.为了训练1D CNN,采用自适应标记机制标记训练噪声,减少人工操作.此外,EGFANC方法仅需要单个预训练的控制滤波器,显著减少了ANC的前期准备工作并提高了其实用性.
1 EGFANC方法
图1是EGFANC方法的系统框图.图下方虚线框中,在协处理器上利用1D CNN根据每帧的噪声数据提供对应的二进制权重向量.该二进制权重向量与预训练完成的固定子控制滤波器组进行加权和运算,从而生成控制滤波器W(z),用于上方虚线框中的实时噪声控制.EGFANC方法采用二进制权重,以减少计算和存储空间的负载.此外,在协处理器上以噪声帧为单位执行控制滤波器的生成,在嵌入式控制器中以采样率为单位执行实时噪声控制,并在控制阶段异步更新控制滤波器系数.其中:x(n)是参考麦克风获取的参考信号; P(z)和S(z)分别是初级路径和次级路径; d(n)为参考信号x(n)经初级路径P(z)后得到的初级噪声信号; ys(n)为控制器W(z)输出的次级信号y(n)经次级路径S(z)传播后生成的抵消信号; e(n)为初级噪声信号d(n)与抵消信号ys(n)叠加后得到的误差信号.

图1EGFANC方法系统框图
Fig.1System framework of the proposed EGFANC approach
1.1 系统结构
图2是EGFANC方法的具体结构,在噪声数据输入1D CNN之前,需要对数据进行预处理,即归一化操作:
(1)
式中,max[·]与min[·]分别表示参考信号x(n)的最大值和最小值,这一操作将x(n)缩放到(-1,1)范围内,并保留包含相位信息的负值部分,这在ANC应用至关重要[17].
1 D CNN的架构包含卷积层(Conv Layer)、池化层(Pooling)、两个残差块(Residual Block)、Grouped-LSTM模块以及全连接层(FC Layer)[18].每个残差块包括两个卷积层、批量归一化层(Batch Norm)和ReLU非线性层,其中,卷积块与残差块中卷积层超参数已在图2中以(卷积核、输出通道数、卷积步长、零填充)形式给出.本文对原有的1D CNN模型进行改进,即在残差块之后、全局池化层之前添加了Grouped-LSTM(组合长短时记忆)模块,它由采用组策略的两个LSTM组成,其中组数设置为2.在卷积层和残差块之后引入Grouped-LSTM模块使得网络能够更充分地理解和应用序列数据的特征和时序信息,从而提高了网络对序列数据的理解能力,提升了网络的分类性能.同时,Grouped-LSTM模块的引入有助于网络更好地适应不同长度的序列数据,并减轻序列数据中的长期依赖问题,因此也增强了网络的泛化能力.
每个残差块中均采用快捷连接(即将残差块输入直接加到残差块输出上),因为残差架构已被证明易于优化[19].同时,在1D CNN中第1个卷积层采用宽的感受野(Receptive Field,RF),而其余卷积层则使用窄的感受野,以充分利用全局和局部信息.在EGFANC方法中,获取二元权重向量属于多标签分类问题[20],故在1D CNN的输出层采用Sigmoid函数.训练模型时采用二元交叉熵(Binary Cross-Entropy,BCE)损失函数.
1.2 子控制滤波器构造
子控制滤波器的构造是EGFANC方法中的关键步骤.基于滤波器完美重构理论的实用滤波器分解技术来构造子控制滤波器[21].首先,利用FxLMS算法确定的最优控制滤波器作为预训练完成的宽带控制滤波器.
假设预训练的宽带控制滤波器阶数为N,即:
(2)
c将被分解为完美重构滤波器组,对c进行离散傅里叶变换(Discrete Fourier Transform,DFT),可得其频谱为
(3)
式中,FN表示DFT矩阵.根据频域实数信号的共轭对称性,将控制滤波器C划分为M个子控制滤波器:

图2EGFANC方法具体结构
Fig.2Specific structure of EGFANC
(4)
式中,第m个子控制滤波器的频谱可表示为
(5)
式(5)中,当m≠M时可得:
(6)
当m=M时,子控制滤波器的频谱为
(7)
式(6)与(7)中I为子滤波器带宽即
(8)
式中,为向下取整运算.
第m个子控制滤波器在时域上表示为
(9)
式中,为DFT逆矩阵.
因此,根据式(3)、(4)和(9)可以得到控制器输出次级信号y(n)为
(10)
式(10)表明宽带控制滤波器c可以通过其所有子控制滤波器cm在时域上进行完美地重构.因此,基于滤波器完美重构理论对预训练的宽带控制滤波器进行分解,可以获得多个固定的预训练子控制滤波器.
1.3 自适应标签机制
为了自动标记噪声数据集中噪声对应的权重向量标签,采用图3所示的自适应标记机制.1D CNN的输入和输出分别是一帧(1 s时长)噪声及其对应的二进制权重向量.在训练阶段,训练噪声输入是参考信号x(n).
因此,第m个子控制滤波器的输出为
(11)
将所有子滤波器的输出进行加权求和可得:
(12)
其中:y(n)为次级信号矢量,
(13)

图3自适应标签机制原理
Fig.3Principle of adaptive labeling mechanism
g(n)为组合权重矢量,
(14)
因此,可以计算出误差信号e(n)为
(15)
式中:d(n)与s(n)分别为误差麦克风处初级噪声信号和次级路径S(z)的脉冲响应; *表示线性卷积运算.
基于最小均方误差准则,设系统的目标函数为
(16)
通过LMS算法最小化目标函数可得权重矢量的更新公式为
(17)
式中:μ是更新步长; y′(n)计算公式为
(18)
一旦式(17)收敛,通过对最优权向量进行取舍得到二进制权向量T.
(19)
式中, 表示第m个子控制滤波器的最优组合权重,所有子滤波器的权重组成1D CNN的输出即二进制权向量T,该二进制权向量被视为输入训练噪声所对应的标签.式(19)中的0.5是阈值,其设置决定网络最终输出的二进制权重向量,即决定对应子频带的子控制滤波器是否参与生成新的控制滤波器,进而影响最终生成的新控制滤波器.即当子频带对应的权重向量大于等于0.5时,认为该子频带对应的噪声在整体噪声中占比较大,需要进行降噪处理,此时该子频带对应的子控制滤波器参与新控制滤波器的生成.实验表明阈值的设置不能大于0.5,实际中可进行微调,对整体性能影响较小.
1.4 控制滤波器生成
模型训练完成后,1D CNN根据输入噪声输出对应的二进制权重向量.然后,将权重向量与所有子控制滤波器进行加权求和生成新的控制滤波器:
(20)
实时控制器将使用生成的控制滤波器来消除噪声,此时误差信号为
(21)
综上所述,对于给定的输入噪声,EGFANC方法通过自适应的组合固定子控制滤波器来生成所需控制滤波器,从而可以为每种类型的噪声生成更合适的控制滤波器.
2 实验结果与分析
2.1 网络训练
在训练阶段,EGFANC方法仅需要预训练完成一个宽带控制滤波器即可获得实验所需的所有子控制滤波器.选取的预训练宽带控制滤波器频率范围为目标降噪频率范围,子控制滤波器数量的划分依据每个子控制滤波器处理的频率范围决定.同时,该子控制滤波器处理的频率范围设置不宜过大或过小,过小导致划分的子控制滤波器频响波动较大,过大则导致子控制滤波器降噪不够精确.预训练的宽带控制滤波器按照频率被划分为15个子控制滤波器,图4a和图4b分别展示了宽带控制滤波器和所有子控制滤波器的频率响应.控制滤波器的阶数和采样率分别设置为1 024阶和16 kHz.此外,训练阶段采用频率范围为20~7 980 Hz的带通滤波器作为初级路径和次级路径.
在训练阶段,实验采用文献[18]中GFANC方法在训练网络模型时所使用的合成噪声数据集(https://researchdata.ntu.edu.sg/dataset.xhtml?persistentId=doi:10.21979/N9/ETJWLU).该合成噪声数据集分为3个子集:80 000个噪声数据用于训练,2 000个噪声数据用于验证,其余2 000个噪声数据用于测试.合成噪声数据是将白噪声通过各种随机选择的中心频率和带宽的带通滤波器进行过滤生成.数据集中的每个噪声数据的时长为1 s,采样率为16 kHz.
将本文的1D CNN模型与其他几种基准网络进行了比较[22].在表1中列出了文献[22]中M3、M5、M11、M18网络与GFANC中1D CNN网络,以及EGFANC中1D CNN网络在测试集上的准确率比较结果.其中,测试准确率指的是在测试数据集上预测二进制权重的准确性.实验结果显示,本文的1D CNN模型达到了97.80%的最高预测精度.这表明该模型能够有效地从原始波形中提取出区分性特征,从而在不同噪声情况下提供适当的二进制权重.与其他网络相比,GFANC方法中网络模型参数量最低,仅为0.21×106.本文所用的1D CNN模型参数量为0.34×106,略高于GFANC方法的网络模型参数量,这是因为引入Grouped-LSTM模块后导致了网络参数数量的增加.

图4预训练宽带控制滤波器及其子滤波器频率响应
Fig.4Pre-trained broadband control filter and its sub-filter frequency response
表1不同网络测试准确率比较
Table1Comparison of test accuracy rates between different networks

2.2 基准环境实验结果
采用与文献[18]中GFANC方法相同的仿真声学路径,即将频率范围为20~7 980 Hz的带通滤波器作为初级路径和次级路径.对比方法为文献[18]中提出的GFANC方法和传统FxLMS算法,其中,FxLMS算法的步长设置为0.000 1以避免发散.采用飞机噪声(Aircraft)对EGFANC、GFANC和FxLMS三种方法的降噪性能进行评估.
图5a—d分别展示了EGFANC方法、GFANC方法和FxLMS算法控制Aircraft噪声后残留噪声的时域波形,以及三种方法的每秒噪声衰减水平对比结果.根据图5的结果可以发现,EGFANC方法相较于GFANC方法和FxLMS算法具有更快的响应速度和更高的降噪水平.具体而言,在[1,2)s以及[2,3)s的时间段内,EGFANC方法的降噪水平分别比GFANC方法提升约10 dB和5 dB.这表明1D CNN在引入Grouped-LSTM模块后,能够更好地利用噪声数据的特征和时序信息,从而输出更加准确的二进制权重向量,进而生成更适用于Aircraft噪声的控制滤波器.然而,EGFANC方法和GFANC方法均无法在第1秒处理噪声,这是因为它们需要利用第1秒的噪声数据来更新下一秒的控制滤波器系数.观察图5c可以发现,在8 s后,FxLMS算法的收敛过程才趋于稳定,相比之下,EGFANC方法在1 s后便迅速衰减噪声,显著提高了降噪响应速度.
2.3 变压器噪声实验结果
2.2 节的实验结果表明,EGFANC方法在仿真环境中具有良好的降噪性能和鲁棒性.本节验证EGFANC方法在变电站主变压器噪声场景下的降噪性能.
图6为变电站主变压器现场及其噪声的频谱.从图6b可以看出,主变压器噪声频谱是一种谐波结构的噪声,其频谱在50 Hz的倍频点上出现峰值,特别是100、150、200~1 000 Hz等频点处能量较大,而1 000 Hz以上的谐波结构虽也显著,但是其能量已经较1 000 Hz以下部分衰减了20 dB以上.
考虑到变压器噪声频谱的特点,本节所用预训练宽带滤波器为20~980 Hz,并将其按照频率划分为5个子滤波器,即每个子滤波器频率范围约为200 Hz.为了训练1D CNN重新生成合成噪声数据集,合成噪声频率范围为20~980 Hz.生成的合成噪声数据集分为3个子集:80 000个噪声数据用于训练,2 000个噪声数据用于验证,其余2 000个噪声数据用于测试.合成噪声数据是将白噪声通过各种随机选择的中心频率和带宽的带通滤波器进行过滤生成.数据集中的每个噪声数据的时长为1 s,采样率为16 kHz.

图5EGFANC、GFANC和FxLMS控制aircraft噪声的性能对比
Fig.5Performance comparison of EGFANC, GFANC and FxLMS approaches under aircraft noise condition

图6变电站主变压器及其噪声频谱
Fig.6Substation main transformer diagram and main transformer noise spectrum
采用2.2节的仿真声学路径进行实验,以验证EGFANC方法在控制主变压器噪声的有效性.图7展示了在仿真声学路径中EGFANC、GFANC和FxLMS三种方法控制变压器噪声后残留噪声频谱以及3种方法每秒噪声衰减水平对比结果.观察图7a可以发现,相较于FxLMS算法,EGFANC方法在频率为250、350、450、500处以及600~750 Hz范围内降噪性能大幅提升.此外,EGFANC方法在750 Hz以内频率范围内降噪性能始终优于GFANC方法,进一步验证了改进的1D CNN对系统降噪性能的提升.观察图7b结果可以发现,EGFANC方法从2 s开始便迅速抑制变压器噪声,并在FxLMS趋于收敛后与其保持相当的降噪性能.

图7EGFANC、GFANC和FxLMS三种方法控制变压器噪声的性能对比
Fig.7Performance comparison of EGFANC, GFANC and FxLMS approaches in controlling transformer noise
3 结论
本文研究了改进的生成式固定滤波器有源噪声控制(EGFANC)方法,该方法通过引入Grouped-LSTM模块对一维卷积神经网络(1D CNN)进行改进,基于滤波器完美重构理论对预训练的宽带控制滤波器进行分解,1D CNN输出的二进制权重与子控制滤波器能够自适应地组合以生成适用于各种类型噪声的控制滤波器.基准仿真实验表明EGFANC方法具有良好的降噪性能,进一步用变压器噪声进行实验,验证了EGFANC方法处理谐波噪声时具有较好的降噪性能.