摘要
智能站主设备保护采样回路异常因具有隐蔽性、瞬时性、不稳定性等特点而难以发现.本文提出一种基于同源录波数据的主设备保护采样回路异常预警方案.首先,通过合理设定预警门槛和波形分析判据判断采样回路是否出现异常;其次,基于采样回路缺陷处理文本及设备运维手册等信息构建采样回路运维知识图谱,实现采样回路异常辅助决策;最后,以某变电站实际缺陷为例进行案例分析.结果表明,所提方案能有效地发现采样回路异常,构建的知识图谱可为运维人员提供异常处置决策参考,极大地缓解人工压力.
Abstract
The abnormalities in the host device protection sampling loops of smart substations are difficult to detect due to their characteristics of concealment,transience,and instability.Here,we propose an early warning scheme for the abnormal sampling loops of the host device protection in smart substations based on homologous waveform recording data.First,the occurrence of abnormal sampling loops is determined by reasonably setting the early warning thresholds and waveform analysis criteria.Second,a knowledge graph for the operation and maintenance of the sampling loops is constructed based on information of the equipment operation and maintenance manual related to the sampling loops,to realize the aided decision-making for handling abnormal sampling loops.Finally,a case study is carried out based on an actual defect in a substation.The results show that the scheme is effective in detecting the abnormalities in the sampling loops,and the constructed knowledge graph can provide decision-making references for operation and maintenance personnel in handling abnormalities,significantly reducing manual workload.
0 引言
主设备保护在电力系统的安全稳定运行中发挥着重大作用.在智能变电站中,大部分主设备保护装置需要采集多个电气量进行综合判断分析,若采集的电气量出现异常,会影响保护设备的正常工作,甚至引发误动或拒动[1].据统计,近年来某电网220 kV及以上电压等级主设备保护因为采样回路异常引起的保护异常动作行为占比达到45%.因其具有隐蔽性、瞬时性、不稳定性等特点,采样回路异常一般难以发现.
智能站采样回路主要包括合并单元、智能终端、继电保护装置、故障录波装置等.常见的采样回路异常主要包括合并单元异常、采样回路光纤异常、设备老化等.合并单元异常主要包括采样板卡故障、参数配置错误、电磁骚扰导致故障等[2].合并单元采样板卡在正常运行时会存在发热等现象,如果屏柜内散热不良,可能导致采样数据处理短时异常或激光器供能故障,最终导致采样异常.对于采样回路光纤异常,光缆或尾纤受较大应力挤压、光纤熔接质量不合格等,都有可能引起光纤回路损耗增大、激光器驱动电流高和数据电平低等问题.
目前,如何实现采样回路异常的快速精准检测已受到研究者的广泛关注,例如:戴志辉等[3]提出一种基于快速动态时间规整算法的故障录波数据智能比对方法,为采样回路异常时保护装置故障录波文件与故障录波器录波文件进行同源数据比对奠定了基础,但未给出具体的采样回路异常分析方法;余嘉彦等[4]分析了采样回路异常给继电保护装置带来的影响,并据此提出一种基于采样通道重组的采样回路异常处理方案,短暂提高了继电保护装置的可用性,但未给出长久的解决方案;姚致清等[5]提出一种采样回路断线时合并单元产生直流偏置的解决方法,通过改造ADC芯片外围回路来减小采样回路断线情况下合并单元输出的直流偏置,提高了合并单元装置运行的可靠性及输出数据的准确性,但对于采样回路整体的异常预警则无能为力;刘玮等[6]提出一种基于差值有效值的智能录波器暂态同源比对技术,通过精确比对继电保护装置和智能录波器的故障录波文件,实现对采样回路的监测及预警,该方法提高了继电保护装置电气量数据的准确性;刘颖等[7]提出一种高可靠性的采样新方法,通过滤波设计、硬件A/D回路设计、软件算法分析判别等方式,对采样回路异常进行预警分析,减少了因采样回路异常导致的继电保护不正确动作;胡蓓等[8]提出一种基于光纤电流互感器独立双采样的采样异常检测方法,通过建立多条采样回路,对其采样数据进行比较得到差异值,再将差异值与预设的采样数据的异常阈值进行比较发现采样回路异常行为;崔亚芹等[9]基于保信主站提出一种对同一间隔双重化配置保护装置录波进行同源比对的方法,能够对采样回路是否出现异常进行判断;潘志腾[10]针对智能站采样回路异常难以发现的问题,对继电保护设备通过MMS上传的双AD采样值和双重化保护的两套采样值进行比较,当相对误差超出阈值时则认为采样回路出现异常.上述文献并未给出具体的异常处置方法或建议,即仍需投入大量人力排查异常原因.
为了更好地实现采样回路异常检测并提高异常处置效率,本文提出一种基于同源录波数据的主设备保护采样回路异常预警方案.主要针对智能站采样回路中合并单元等设备因参数配置错误、设备老化等问题造成的采样异常情况进行预警.通过对同源录波数据进行比对判别,并融合知识图谱技术参与辅助决策,有效地提高智能站运维效率,缓解人工排查压力,减少由于采样回路异常导致的保护异常.
1 主设备保护采样回路异常预警
目前,为保证安全可靠运行,220 kV智能站内录波文件配置形式主要有两种:一种是“双套220 kV录波文件+单套110 kV录波文件”; 另一种是“双套220 kV线路录波文件+双套220 kV主变录波文件”.500 kV智能变电站内录波文件配置形式仅一种,即“双套500 kV线路录波文件+双套500 kV主变录波文件+双套220 kV录波文件”.同源录波数据即为双套录波文件分别通过各自过程层网络采集到的合并单元发出的采样数据.当主设备保护采样回路处于正常状态时,双套录波文件中的采样数据是相同的; 当采样回路处于异常情况时,双套录波文件中的采样数据会出现差异.通过对同源录波数据进行比对,即可判断采样回路是否处于异常状态.
基于同源录波数据的主设备保护采样回路异常预警流程如图1所示.
运维人员根据系统当前运行工况确定异常预警门槛值及波形分析判据,为继电保护信息管理(简称保信)系统[11]进行同源录波数据比对分析提供支撑.若比对结果超过预警门槛值,则根据预警信息查询采样回路运维知识图谱得到相应问题检修或处置建议,为运维人员提供参考.若知识图谱中不存在相应处置措施,运维人员完成缺陷处理后可以总结异常处理过程和建议,并以增量学习方式将新增预警异常处置措施添加至原有知识图谱中,为以后的异常处置做好准备.

图1采样回路异常预警流程
Fig.1Sampling loop abnormality warning process
2 主设备保护采样回路运维知识图谱构建
2.1 主设备保护采样回路运维知识图谱构建
知识图谱技术的发展为电力系统二次设备辅助决策提供了全新的解决思路和技术手段.知识图谱最早由谷歌公司提出,它是一种大规模的语义网络,包含实体、概念以及各种语义关系[12].知识图谱作为一种模拟人类思维方式的多源异构实体及关系表征大数据技术,不仅数据存储结构性能优越[13-14],同时具有强大的实体关系推理能力[15],在电力领域的数据运维、电力文本表征及电网动态辅助决策等方面已有初步应用[16-19].
智能变电站中保存了大量二次设备缺陷分析管理的文本数据,这些数据包含二次设备以往发生的各类缺陷情况及相应改进措施,但未能有效利用,闲置于数据库中[20].本文以智能站中长期闲置的二次设备缺陷处理文本数据为主体,结合合并单元、智能终端等二次设备标准说明书、检修维护手册等对与设备运维相关的关系和实体进行分类,构建采样回路知识图谱并进行可视化呈现与存储,当出现异常时,其可为运维人员提供辅助决策建议,形成“缺陷文本历史数据+运维人员专业知识”的二次智能运维模式,大大缓解人工排查压力,有效地提高电网二次设备的故障应急处理能力.
主设备保护采样回路运维知识图谱构建流程如图2所示.

图2主设备保护采样回路运维知识图谱构建流程
Fig.2Building process of knowledge graph for operation and maintenance of sampling loops for host device protection
变电站中可能出现的缺陷众多,不同运维人员的缺陷记录习惯及方式均有所不同,进而形成了非结构化的缺陷文本数据.首先需要利用实体抽取(命名实体识别)技术将非结构化数据转化为结构化数据,进而完成知识图谱的构建.
2.2 命名实体识别技术
命名实体识别(Named Entity Recognition,NER)是指识别文本中具有特定意义的实体,包括人名、地名、机构名、专有名词等.对于主设备保护采样回路缺陷文本而言,命名实体识别是指对缺陷部位、缺陷现象、缺陷原因、缺陷处理建议等专业词汇的提取并分类.由于主设备保护采样回路缺陷文本专业性较强,直接采用jieba等开源分词工具效果不佳,本文首先根据抽取目标对缺陷文本数据集进行实体标注并分为训练集和测试集,接着采用BiLSTM-CRF模型对训练集进行训练,并用测试集验证模型的准确性,完成命名实体识别.
2.2.1 BiLSTM-CRF命名实体识别模型
基于BiLSTM-CRF方法进行命名实体识别,该模型由Word2vec词向量预训练模型、BiLSTM语义提取层和CRF解码层3部分构成,模型整体结构如图3所示.
Word2vec编码层能够将完成实体标注的主设备保护采样回路缺陷数据集转化为词向量(如图3中xt-2、xt-1、xt、xt+1、xt+2所示),并通过线性加权的方式由词向量生成句向量.双向长短期记忆(Bi-directional Long Short-Term Memory,BiLSTM)神经网络层由两个长短期记忆(LSTM)神经网络构成,一个随时间正向,另一个随时间逆向,能够全面捕捉过去和未来的所有信息特征,得到每个词对应每个标签的得分概率(如图3中ht-2、ht-1、ht、ht+1、ht+2所示),再经过条件随机场(Conditional Random Field,CRF)层即可得到每个词对应每个标签的总体概率.

图3BiLSTM-CRF模型结构
Fig.3BiLSTM-CRF model structure
将Word2vec编码层生成的词向量输入到BiLSTM网络中,即可完成缺陷文本词向量信息的双向编码并计算得到文本上下文相关的语义信息.LSTM结构如图4所示.

图4LSTM结构,
Fig.4LSTM structure
各状态量的计算公式如下:
(1)
(2)
(3)
(4)
(5)
(6)
其中:σ和tanh为激活函数; ht、ct分别为当前时刻输出的单元状态、隐藏层状态; ht-1、ct-1分别为上一时刻输出的单元状态、隐藏层状态; xt为当前时刻的输入; ft、ot分别为遗忘门、输出门的状态; it、分别为记忆门状态当前时刻候选值向量; wf、wi、wo为相应的权重矩阵; bf、bi、bo为相应的偏置向量.
BiLSTM层能够从文本序列中提取命名实体,但无法学习到状态序列(输出标注)之间的关系,例如B类标注后面只可能跟随I类或O类标注,不可能再跟随B类标注.为解决该问题,在BiLSTM层后添加条件随机场模型,它可学习文本上下文关联信息,使得命名实体识别结果更加准确.将BiLSTM层输出的语义信息输入到CRF层,采用Viterbi算法进行解码,由CRF模型计算最优解,并输出概率最大的标签序列作为输入句子中每个字符的实体类别,完成命名实体识别.
2.2.2 实验环境与超参数
采用Python语言进行编程,计算机配置:CPU Intel i5-8300H@2.30 GHz,GPU NVIDIA GeForce GTX 1050 Ti,内存为8 GB,操作系统为 Windows10 64 bit.
超参数设置如表1所示.表1中:Dropout为神经元的随机丢弃率; Adam为自适应矩阵计算法模型求解优化器; Batch_size为每批次样本训练数量; Epoch为训练轮数.
表1超参数设置
Table1Hyperparameter setting

2.2.3 数据集与标注方式
以某地区近10年智能站采样回路缺陷记录文本作为训练数据集并对其进行标注.其中,训练集缺陷文本数量为8 000条,测试集缺陷文本数量为2 000条.
对于实体标注,采用BIO标注方式,则一共有9种实体类型,如表2所示.
表2实体标注标签及含义
Table2Entity annotation tags and their meanings

例如,某条采样回路缺陷记录的非结构化数据标注结果如下所示:
合PLA-B/并PLA-I/单PLA-I/元PLA-I/对PHE-B/时PHE-I/异PHE-I/常PHE-I/装REA-B/置REA-I/死REA-I/机REA-I/重SUG-B/启SUG-B/后O/复O/归O/
2.2.4 评价指标
选取精确率(P)、召回率(R)、F1值(F1)作为模型评价指标.计算公式如下:
(7)
(8)
(9)
其中:TP为模型正确识别出实体的样本数量; FP为能识别出实体但与标签不一致的样本数量; FN为应该能识别出实体但没有识别出的样本数量.
2.2.5 BiLSTM-CRF模型有效性验证
选取隐马尔可夫模型(Hidden Markov Model,HMM)、CRF模型及BiLSTM模型与本文BiLSTM-CRF算法进行比较,4种算法的实体抽取效果如表3所示.
由表3可以看出,本文算法在精确率、召回率、F1值3项评价指标上分别达到87.45%、87.88%和87.56%,能够满足缺陷文本实体抽取要求.表3结果表明:BiLSTM语义提取层的引入,能够使模型更加全面地学习到缺陷文本的特征语义信息,进而提高实体抽取准确率; CRF层的引入能够使模型考虑到句子中相邻实体的依赖关系,确保输出的实体标签符合语法规则,使预测结果更加准确.
2.3 知识图谱构建及Neo4j数据存储与可视化
上述命名实体识别技术已将非结构化缺陷文本中的缺陷现象、缺陷部位、缺陷原因、缺陷建议抽取出来,本节结合设备类型、设备型号、生产厂家等已有结构化数据,基于图5所示规则,在Neo4j图数据库中完成主设备保护采样回路运维知识图谱的构建.
表3命名实体识别效果
Table3Named entity recognition performance

目前数据库技术主要分为关系型数据库(SQL)和非关系型数据库(NoSQL).图数据库属于NoSQL的一种,其数据存储结构和数据查询方式都是以图论为理论根基,使用节点和关系进行直接建模,支持百亿量级巨型图的快速高效运算和复杂关系分析.Neo4j是用JAVA语言开发的开源NoSQL图数据库之一,可以实现专业数据库级别的数据模型存储.
1)Neo4j基于Cypher声明式查询语言进行构建,语言简单易上手,可直观有效地查询节点之间的关系.而使用Gremlin、SPARQL、nGQL等图查询语言构建的数据库则比较复杂,且无法表达节点之间的关系.
2)Neo4j的数据模型隐含于存储数据中,后期可随时添加、更改数据类型.而其他数据库的数据模型在数据库底层开发时就已确定,后期更改会导致结构变动,影响数据库运行的稳定性和可靠性.

图5知识图谱构建规则
Fig.5Rules for building knowledge graphs
3)Neo4j将数据的节点和关系分开存储,使用免索引邻接方式的图存储结构,可以快速处理数据间关系.而其他数据库中的数据存储于预定义好的固定结构表中,数据库性能随着数据间关系的复杂程度和规模的增加而下降.
本文基于Neo4j图数据库对经过命名实体识别后的采样回路缺陷处理结构化文本进行存储和可视化,具体步骤如下.
1)将各类实体以csv表格文件的形式进行存储,存储格式为utf-8,存储路径为Neo4j下的import文件.
2)在Neo4j网页端利用以下语句完成实体存储(以缺陷部位实体为例):
“LOAD CSV WITH HEADERS FROM "file:///缺陷部位.csv" AS line
MERGE(p:缺陷部位{buweiid:line.buweiid,缺陷部位:line. 缺陷部位})”
3)在Neo4j网页端利用以下语句完成基于规则的实体关系存储(以异常产生原因实体关系为例):
“LOAD CSV WITH HEADERS FROM "file:///异常产生原因.csv" AS line
match(from:缺陷现象{xianxiangid:line.xianxiangid}),(to:缺陷原因{qxyyid:line.qxyyid})
merge(from)-[r:异常产生原因{异常产生原因:line. 异常产生原因}]->(to)”
4)利用以下语句将所有的节点关系显示出来,完成知识图谱构建:
“MATCH (n) -[r]- (m) RETURN n, r, m”
采样回路运维知识图谱如图6所示.其中,每个节点代表对应的实体内容,不同颜色代表不同采样回路相关设备运维信息实体,不同实体之间连线表示两者之间存在的关系.
图6采样回路运维知识图谱
Fig.6Knowledge graph of sampling loop operation and maintenance
3 采样回路异常预警判据设定
3.1 设定预警门槛
为了可以直观地展示故障录波波形同源比对差异,本文设定了触发异常预警的门槛值,通过对设定数据窗内同源波形电压幅值、电流幅值进行判断实现预警功能.门槛值类型如表4所示,其中,电压幅值、电流幅值绝对门槛值分别为二次额定电压、额定电流的倍数.异常预警门槛值根据系统运行工况、运维经验等动态调整,不同运行工况下配置的异常预警门槛值不同,一般电压幅值、电流幅值所设定绝对门槛值为0.01~0.04之间.
表4故障录波波形同源比对门槛值类型
Table4Threshold values for homologous comparison of fault recording waveforms

3.2 波形分析判据
波形分析判据主要包括电压幅值比对判据和电流幅值比对判据.为提高采样回路异常预警速度和效率,按照录波触发时刻前2个周波到触发时刻后6个周波设置数据窗,只对数据窗内的波形数据进行分析研判.为避免采样回路异常预警发生误判,当电压、电流幅值超过异常预警门槛值并且持续5 ms才会发出异常预警信息.
1)电压幅值比对判据.
设2个待比对同源故障录波文件电压通道波形为Upk和Uqk.Upk和Uqk分别是由数据窗内一系列电压采样点(up1,up2,···,upk)和(uq1,uq2,···,uqk)组成的时间序列,k为所设定数据窗采样点个数.电压幅值特征差值公式Udf(k)为
(10)
使用电压幅值绝对门槛值和相对门槛值时的幅值比对判据分别为
(11)
(12)
式中:Un为电压额定值; upk为故障录波文件电压通道波形Upk在采样点k处的电压幅值; uqk为故障录波文件电压通道波形Uqk在采样点k处的电压幅值.
2)电流幅值比对判据
假设2个待比对同源故障录波文件电流通道波形为Ipk和Iqk.Ipk和Iqk分别是由数据窗内一系列电流采样点(ip1,ip2,···,ipk)和(iq1,iq2,···,iqk)组成的时间序列,k为所设定数据窗采样点个数.电流幅值特征差值公式Idf(k)为
(13)
使用电流幅值绝对门槛值和相对门槛值时的幅值比对判据分别为
(14)
(15)
式中:In为电流额定值; ipk为故障录波波形电流幅值Ipk在采样点k处的电流幅值; iqk为故障录波波形电流幅值Iqk在采样点k处的电流幅值.
4 案例分析验证
为验证基于同源录波数据的主设备保护采样回路异常预警效果及采样回路运维知识图谱的可行性,以某变电站实际缺陷为例进行分析.根据当前电网运行工况配置的异常预警门槛值如表5所示.
表5故障录波波形同源比对门槛值
Table5Fault recording waveform comparison threshold

通过调取当天产生的同源录波文件,发现某220 kV变电站1号主变中侧合并单元保护电压A、B、C三相采样频繁出现不一致现象,触发预警机制.从同源A、B两套故障录波器中调取故障录波波形,经过处理后形成的8个周波数据窗波形如图7—9所示.可以看出,A、B、C三相的双套同源故障录波数据均在第3个周波时出现采样不一致的情况,且采样值相差较大.
继电保护信息管理系统是继电保护运行管理、辅助分析不可或缺的技术支持系统,支持信息的充分获取和共享,可扩展性强.继电保护信息管理系统主站根据波形分析比对判据将同源录波数据作差并与预设门槛值进行比较,生成的采样回路异常判据计算结果如图10所示.
由图10可知,A、B、C三相的双套同源故障录波数据差值均远远超过预设的异常预警门槛值且持续时间超过5 ms,满足异常预警条件,模块触发采样回路异常预警并导出对应预警报告单.异常预警报告单中详细描述了预警报告时间、所处厂站等基本信息以及异常通道名称、异常设备型号名称、采样回路异常情况、采样回路异常判据结果等预警信息,运维人员可据此快速详细了解异常情况,为异常处理奠定基础.

图7A套/B套同源故障录波数据(A相)
Fig.7A/B set of homologous fault recording data (phase A)

图8A套/B套同源故障录波数据(B相)
Fig.8A/B set of homologous fault recording data (phase B)

图9A套/B套同源故障录波数据(C相)
Fig.9A/B set of homologous fault recording data (phase C)

图10采样回路A、B、C相电压异常判据计算结果
Fig.10Calculation results of abnormal voltage criteria for phase A, B, and C of sampling loops
发出标准预警报告单后,通过调取同一时段内相关设备监控告警信息,发现同源线路间隔A套PCS-931A型线路保护装置多次发出“装置异常启动录波”告警.利用MATCH语句在主设备保护采样回路运维知识图谱查询相应告警信息对应处理方式,查询结果如图11所示.由于是保护电压采样出现问题,给出如下运维建议:检查合并单元至保护光纤是否正常; 检查合并单元发送数据的品质是否正常; 检查合并单元与保护装置的检修压板是否一致.
根据知识图谱给出的运维建议发现,合并单元产生问题的概率较大,因此通过采样回路运维知识图谱查询合并单元输出采样异常相应的处理方式,查询结果如图12所示.知识图谱给出的运维建议为:运维人员应仔细检查时间同步装置各信号指示灯,记录液晶面板显示内容,结合其他装置进行综合判断; 若不能自行处理时申请专业班组并通知厂家到站进行处理.
缺陷发生后,运维人员通过读取合并单元异常记录和网络分析记录发现:该站时间同步装置输出的对时信号异常,导致合并单元装置输出采样异常.通过网络分析记录可以看出,多台合并单元的采样序号(SmplCnt序号)几乎同时发生跳变,由于保护装置与合并单元是“一对一”连接,当保护装置收到序号不连续的SV报文后会发出“装置异常启动录波”告警,并闭锁相关保护.后续通过对时间同步装置消缺和升级合并单元软件版本消除隐患.
综上可以看出:基于双套同源录波数据比对的方法,运维人员可以方便快速地发现采样回路异常并通过异常预警报告单详细了解异常情况,为异常处理奠定基础; 由采样回路相关设备运维知识图谱得出的解决方案与实际情况相吻合,说明所建立的知识图谱具有较高的可靠性和实用性; 当采样回路出现异常时,所构建知识图谱可为运维人员提供辅助决策参考,进而大大提高采样回路运维效率.
5 结论
针对智能站主设备保护采样回路异常难以发现的问题,提出一种基于同源录波数据的智能站采样回路异常预警方法,结论如下:
1)根据预设门槛值和波形对比分析判据对同源录波波形进行比对分析,同源录波数据差值超过异常预警门槛值一段时间则会启动预警机制并将预警结果以标准预警报告单的形式导出.案例分析结果验证了所提方法能有效识别采样回路异常,为运维人员排查故障隐患奠定基础,减少由于采样回路异常导致的主设备保护异常动作.
2)提出一种基于BiLSTM-CRF方法的实体抽取模型,对智能站采样回路缺陷处理文本数据、设备运维手册等非结构化数据中蕴含的二次运维关键信息进行高效整合利用,为采样回路运维知识图谱构建奠定了基础.实验结果表明,BiLSTM-CRF实体抽取方法在精确率、召回率、F1值三项整体评价指标上分别达到87.45%、87.88%和87.56%,能够满足采样回路非结构化数据实体抽取要求,且实体抽取效果优于传统机器学习模型.

图11采样回路知识图谱(局部)
Fig.11Knowledge graph of protection device sampling loops (partial)

图12合并单元运维知识图谱(局部)
Fig.12Operation and maintenance knowledge graph for merged units (partial)
3)基于BiLSTM-CRF模型实体抽取结果,完成了主设备保护采样回路运维知识图谱的构建及Neo4j可视化存储.当主设备保护采样回路出现异常时,可为运维人员提供异常处置决策参考,进而提高采样回路异常处置效率.案例分析表明,从采样回路运维知识图谱中得到的异常处置建议与实际解决方法吻合,验证了本文构建的采样回路运维知识图谱的有效性和实用性.
4)将基于同源录波数据的采样回路异常预警技术与基于知识图谱的采样回路运维技术结合起来,实现了采样回路从出现异常到解决异常的全过程高效处理,提高了主设备保护采样回路的异常处理效率.