2021年全球极端恶劣环境条件事故频发,“4·30”南通极端天气灾害、郑州“7·20”特大暴雨、“8·29”美国超强飓风(艾达)等不仅给当地造成了严重的人员伤亡与财产损失,也造成了重大的工业事故[1-3]。通过对1934—2013年因恶劣环境条件导致的Natech事故(natural hazard triggered technological accidents)分析可知,涉及台风、洪水、雷电等的石化行业事故超过150起[4],而因恶劣环境条件导致的长输油气管道事故则占Natech事故总数的5%[5]。虽然长输油气管道事故占比相对较小,但Natech事故的发生常伴随灾难性后果,一旦事故发生很容易对长输油气管道造成毁灭性的打击[6]。与位于固定地点的石化企业相比,长输油气管道面临的恶劣环境条件则更加复杂,尤其是跨国海外长输油气管道,由于跨国协同、抢险救援困难以及敷设地经济欠发达等原因,极端恶劣环境条件侵袭造成的损失更为严重。因此,有必要针对恶劣环境条件下(风、雨、雷电)的海外油气管道进行事故预警研究,以减少因恶劣环境条件所造成的损失。
关于长输油气管道的事故风险预警方法,国内外学者分别采用了Bayes网络[7]、Markov链[8]、事故树[9]、蝴蝶结[10]与Petri网络[11]等。虽然上述研究方法能够对长输油气管道的风险事故进行预测预警,但预警的实现在很大程度上依赖于工艺数据、历史数据以及现场作业人员和专家经验的获取[12-13]。但鉴于恶劣环境条件的发生概率相对较低,针对长输油气管道的研究面临暂无法获取足够数量的可信数据的窘境。于是,基于文本的事故预警方法被提出并被众多专家学者所采用。对于大量的数据文本,深度学习方法能够较好地利用现有的海量文本信息,通过训练相应的事故预测神经网络模型,实现事故预测与关系抽取。目前常用的模型主要有Apriori关联算法[14]、长短期记忆网络(long short-term memory, LSTM)[15]、卷积神经网络(convolutional neural network, CNN)[16]等。虽然基于文本的研究方法在大量有效的训练数据基础上经过长时间的训练,可以对相关专业知识获得良好的信息抽取效果,但对于数据量较小的恶劣环境条件下海外油气管道事故因果关系的抽取仍存在一定的困难。
考虑到恶劣环境条件下的海外天然气管道站场事故文本数据量小的特点,本文选择双向长短期记忆网络-条件随机场(bidirectional long short-term memory - conditional random field, Bi-LSTM-CRF)模型对事故因果关系进行抽取。为保障小样本数据的抽取效果,本文在模型中加入了文本特征,使得模型对因果关系抽取的能力更强、预测结果更准确。在信息抽取完成后,本文构建了基于Neo4j图数据库的恶劣环境条件下海外天然气管道站场事故演化知识图谱,以实现极端恶劣环境条件下海外天然气管道站场事故的路径预测、预警以及应急策略推荐,从而指导现场作业人员进行事故自查与应急处理。
1 研究方法 1.1 Bi-LSTM-CRF模型 1.1.1 双向长短期记忆网络LSTM是一种包含记忆单元、更新门、遗忘门以及输出门的神经网络,是一种改进的循环神经网络(recurrent neural network, RNN),能够解决循环神经网络模型所存在的梯度消失与梯度爆炸问题,从而能够更好地捕获长期依赖效应[17]。由于LSTM模型无法对输入文本的上下文信息进行同时处理,一种可以同时处理文本前后文信息的神经网络模型——双向长短期记忆网络(bidirectional long short-term memory, Bi-LSTM)被提出来。该神经网络模型能够对每个词序列分别采用前向和后向长短期神经网络进行处理,然后将模型输出的结果进行合并,从而提高模型处理信息的速度与准确性[18]。Bi-LSTM模型的结构如图 1所示[19]。
图 1中:
$ h_{t}=\alpha \overleftarrow{h}+\beta \vec{h}, $ | (1) |
$ y_{t}=\sigma h_{t}. $ | (2) |
式中:α、β为常数且α+β=1,σ一般为标准sigmoid激活函数。
1.1.2 条件随机场算法条件随机场(conditional random field, CRF)算法是一种序列化标注算法,能够解决Bi-LSTM模型无法对输出的标签之间的关系进行准确预测的缺点,并能利用转移概率对Bi-LSTM模型的输出结果进行修正,以保证预测标签的合理性[20-21]。CRF算法能够通过临近标签之间的关系获得一个最优的预测序列。该模型的线性结构模型如图 2所示。其中:xi代表Bi-LSTM模型的输出结果,yi表示对输出序列预测的条件概率。
Bi-LSTM-CRF模型就是将Bi-LSTM能够汇总前向与后向双向语义特征的优势与CRF算法能够对输出的临近标签进行预测的优势相结合,以达到提高因果关系抽取准确性的目的。
1.2 知识图谱知识图谱(knowledge graph, KG)是一种对知识的高效表达方式,目前已经被广泛应用于现实世界的知识存储与表达中,例如知识问答、智能推荐、智能搜索等[22-23]。知识图谱是由节点和有向边组成的有向图网络,图谱中的节点是指实体或概念,边是指不同实体间或者概念间的语义关系。知识图谱的基本组成单位就是由实体1、关系、实体2所组成的三元组(实体1,关系,实体2),实体1是指头部实体,实体2是指尾部实体,关系是指实体之间的联系。知识图谱的基本构建流程包括:信息抽取、知识融合、知识表示、知识存储以及知识可视化5个步骤。与传统知识管理方式相比,知识图谱能够直观地表达各实体之间的联系,有利于知识之间的推理与溯源,能够帮助使用者快速有效地获取相关知识、知识逻辑关系以及知识的周边信息等。
2 恶劣环境条件下海外天然气管道站场事故演化知识图谱的构建 2.1 基于Bi-LSTM-CRF的因果关系抽取海外长输天然气管道某站场位于北回归线以南区域的某海岛的土山上,能够接收来自附近海域气田所生产的天然气。该站场具有天然气气质在线分析装置,以及对陆上终端来气进行过滤分离、计量与清管器发送等功能。该站场上游陆上终端来气压力为9.4~9.7 MPa,可以不进行加压直接输送到管道下游站场。
该站场所在地为典型热带雨林气候,天气炎热,雨量充沛,四季温度变化不大,昼夜温差较小。夏、秋两季降水丰沛,比较容易发生洪水、雷电等灾害。此外,该地区独特的位置容易受到台风等气候灾害的影响,近年来有多次台风在该地区范围内登陆。因此,选择该站场对雷电、风、雨恶劣环境条件下的海外天然气站场事故演化进行研究,以期达到减少因恶劣环境条件事故发生而导致的损失。
本文所采用的事故文本数据包括恶劣环境条件下海内外长输天然气管道站场历史事故、现场历史恶劣环境条件记录、健康安全与环境(health, safety and environment, HSE)管理体系文件、站场防减灾措施、设备检维修与保养记录、站场工艺流程等。采用语料扩充方法对数据进行综合整理。在进行因果关系抽取前,需要对站场相关事故文本信息进行预处理,预处理结果如表 1所示。
预处理后的文本信息 | 原因节点 | 结果节点 |
**站场/因/雷击事故/造成了/超声波流量计故障/因/备用流量计未及时启动/造成/天然气输送暂停 | 雷击事故、备用流量计未及时启动 | 超声波流量计故障、天然气输送暂停 |
Brat标注工具可以对文本进行标注以应用于神经网络的训练。本文选择使用BIO标准[20]对恶劣环境条件下的海外天然气管道站场事故文本数据信息进行标注。其中:B(begin)是指因、果节点的头部,I(inside)是指因、果节点的内部部分,O(outside)是指因、果节点的外部部分(不属于因果节点的部分)。
2.2 知识图谱的构建Neo4j是一种高性能的开源图数据库,已被众多知识图谱开发者所使用[24]。该图数据库能够将结构化文本采用三元组的表现形式进行存储与展示,可以较好地支持知识图谱中的各节点、节点属性、节点间关系的存储,并能够以图形的形式直观地展现出来。本文选择使用Neo4j图数据库进行恶劣环境条件下的海外天然气管道站场事故演化知识图谱的建立、存储及后续的应用工作。
2.3 站场事故演化知识图谱的构建流程首先,对恶劣环境条件下的海外天然气管道站场事故文本信息进行预处理,并采用BIO标准进行标注;然后,采用Bi-LSTM-CRF模型对文本信息的因果关系进行抽取,并加入了边界、字词文本特征以增强抽取效果;最后,基于抽取结果采用Neo4j图数据库建立恶劣环境条件下的海外天然气管道站场事故演化知识图谱,并实现站场恶劣环境条件引发事故的早期预警与事故路径预测。恶劣环境条件下的海外天然气管道站场事故演化知识图谱的构建流程如图 3所示。所建立的站场事故演化知识图谱如图 4所示,其中共包含9个站场子系统(图 4中正上方的橘黄色节点群是指站场紧急截断系统,其余节点群顺时针依次为清管系统、流量计量系统、过滤分离系统、气体在线组分分析系统、供配电系统、通信系统、超压保护与安全泄放系统、放空火炬系统),共计24个设备单元、120个节点。
3 案例分析
案例描述:海外长输天然气管道某站场共有3套流量计量设备,2用1备。在一次暴风雨极端恶劣环境条件下,由于雷击事故的发生造成1个流量计量设备的超声波流量计发生故障无法使用,1个流量计量设备的密封阀由于风力等级过大而损坏被迫关停,而备用流量计量设备未能及时启动(后经调查发现备用流量计量设备由于未能及时检修,一直处于故障状态),从而导致该站场天然气输送停止,造成了较大的经济损失。该站场的主要工艺流程如图 5所示。
3.1 基于知识图谱的站场事故路径预测分析
根据所建立的恶劣环境条件下海外天然气管道站场事故演化知识图谱,可以实现在事故发生前,沿着事故的可能演化路径定位关键的风险因素,从而有针对性地采取安全措施避免事故的升级扩散与再次发生。当轻微事故或征兆发生时,根据事故发生的表征与进程进行路径预测分析,从而对路径中的各风险因素进行控制,可以防止恶劣环境条件所引发的事故进一步扩大并造成重大损失。根据海外长输天然气管道某站场所发生的事故案例,结合站场演化知识图谱进行分析,可以得到该站场天然气输送暂停事故的路径预测演化图谱,如图 6所示。
通过对图 6进行分析可知,对于在恶劣环境条件下长输天然气管道站场流量计量系统所发生的3个事件案例,在事故发生早期,如果能够对事故发生的演化路径进行早期预测,然后对可能导致事故进一步扩大的中间路径进行截断并排除故障,就可以实现站场流量计量系统的满负荷或降负荷运行,并避免造成整个长输天然气管道站场停止运行的事故发生。其事故演化路径预测分析如图 7所示。
图 7中:黑色框图代表雷电灾害导致超声波流量器1故障或损坏的演化预测路径;蓝色框图代表强风灾害导致流量计下游密封阀2故障或损坏的演化预测路径。二者共同导致了主用流量计量设备发生故障,从而激活备用流量计量系统的启动。但是,由于备用流量计量设备未按时进行检维修,处于实际故障状态,导致整个站场流量计量系统的故障,因流量计量系统不动作,最终导致整个海外长输天然气管道站场发生停止输送事故。
3.2 基于知识图谱的站场事故预警根据3.1节推断的事故演化路径,如果适时在其预测路径上进行截断,就能够有效防止事故的发生,其中最有效的便是在事故发生前就能够对事故的源头进行控制,并实现设备与站场的安全运行。为减少因恶劣环境条件所导致的站场设备单元故障,有必要对长输管道站场事故进行预警研究,尤其是对因恶劣环境条件直接作用到设备或系统所导致事故的预警。以海外长输天然气管道站场事故演化知识图谱为例,对其中的流量计量系统部分进行剥离,可以得到恶劣环境条件下天然气管道站场流量计量系统事故演化知识图谱,如图 8所示。
当恶劣环境条件(雷电、雨、风)发生时,站场相关设备单元、子系统以及站场整体工艺系统会随着单一恶劣环境条件或多种恶劣环境条件耦合而发生故障或损坏。针对流量计量系统,本文以降雨恶劣环境条件为例。当发生降雨等级过大、降雨时间过长、降雨量过多(其中的一种、两种或三者结合)→洪水灾害→流量计下游密封阀及电动执行机构故障或损坏、超声波流量计故障或损坏、计量设备温度/压力监测仪表故障或损坏(其中的一种、两种或三者结合)→主用流量计量系统故障或损坏。从恶劣环境条件的出现,沿着事故发展路径便可得到事故发生的次序。根据恶劣环境条件预测情况,就可以实现对因大暴雨或特大暴雨所引发的后续事故进行预警。在事故发生之前只需要对相应的设备单元予以保护或关停,并作好充足的准备,便能够有效避免事故的发生。
3.3 基于知识图谱的站场事故应急决策推荐为使现场作业人员能够尽快找到相对应的应急处置方法,本文基于知识图谱设置了相对应的应急决策推荐方案。
根据当前恶劣环境条件预测情况、站场事故预警以及事故演化路径预测情况,对相应站场整体工艺系统、子系统与设备单元进行应急处置方法查询时,知识图谱便能够针对不同类型的恶劣环境条件以及相对应的站场设备单元、子系统及整体系统推荐相应的应急方案。所推荐的方案能够有效避免因为现场作业人员的经验不足、意见不统一,以及因为跨国协同困难所导致的处置遗漏、人员联系延时等问题,从而可以有效减少因恶劣环境条件所引发的事故给海外天然气管道站场带来的损失。
4 结论本文基于Bi-LSTM-CRF对恶劣环境条件下的海外天然气管道站场事故文本信息进行了因果关系抽取。为保证抽取效果,选择在模型中加入了文本特征从而实现了对非结构化文本较为准确的因果关系抽取。根据因果关系抽取的结果,采用Neo4j图数据库建立了单一恶劣环境条件与多种恶劣环境耦合条件下海外天然气管道站场的设备单元、子系统与整体系统的站场事故演化知识图谱。
基于所建立的海外天然气管道站场事故演化知识图谱,对某站场流量计量系统的事故案例进行了路径预测,以期从事故演化路径中进行截断以避免事故的进一步扩大;然后以暴雨极端恶劣环境条件为例,对站场可能产生的事故后果进行了预警分析,以实现从根源上减少恶劣环境条件所造成的事故损失;最后根据不同恶劣环境条件下站场设备单元、子系统及整体系统的事故演化后果,制定了相应的应急决策推荐方案,以实现对恶劣环境条件下海外天然气管道站场事故应急处置方法的高效统一。
本文不仅能够为减少当前极端恶劣环境条件下灾害频发所导致的长输管道事故损失提供研究思路,也能够为解决小样本文本数据的分析预警提供可行性方案,同时还能够为后续基于知识图谱的智能分析与智能应用工作奠定良好的基础。
[1] |
WU M M, WU Z N, GE W, et al. Identification of sensitivity indicators of urban rainstorm flood disasters: A case study in China[J]. Journal of Hydrology, 2021, 599: 126393. DOI:10.1016/j.jhydrol.2021.126393 |
[2] |
MISURI A, ANTONIONI G, COZZANI V. Quantitative risk assessment of domino effect in Natech scenarios triggered by lightning[J]. Journal of Loss Prevention in the Process Industries, 2020, 64: 104095. DOI:10.1016/j.jlp.2020.104095 |
[3] |
QIN R S, KHAKZAD N, ZHU J P. An overview of the impact of hurricane Harvey on chemical and process facilities in Texas[J]. International Journal of Disaster Risk Reduction, 2020, 45: 101453. DOI:10.1016/j.ijdrr.2019.101453 |
[4] |
陈国华, 邹梦婷. 化工园区多灾种耦合关系模型及断链减灾模式[J]. 化工进展, 2018, 37(8): 3271-3279. CHEN G H, ZOU M T. Coupling relationship model of multi-hazard and pattern of chain-cutting disaster mitigation in chemical industry park[J]. Chemical Industry and Engineering Progress, 2018, 37(8): 3271-3279. (in Chinese) |
[5] |
CHEN C, LI C J, RENIERS G, et al. Safety and security of oil and gas pipeline transportation: A systematic analysis of research trends and future needs using WoS[J]. Journal of Cleaner Production, 2021, 279: 123583. DOI:10.1016/j.jclepro.2020.123583 |
[6] |
DAMLE S, MANI S K, BALAMURUGAN G. Natech guide words: A new approach to assess and manage Natech risk to ensure business continuity[J]. Journal of Loss Prevention in the Process Industries, 2021, 72: 104564. DOI:10.1016/j.jlp.2021.104564 |
[7] |
HU J Q, CHEN C G, LIU Z Y. Early warning method for overseas natural gas pipeline accidents based on FDOOBN under severe environmental conditions[J]. Process Safety and Environmental Protection, 2022, 157: 175-192. DOI:10.1016/j.psep.2021.10.046 |
[8] |
OSSAI C I, BOSWELL B, DAVIES I. Markov chain modelling for time evolution of internal pitting corrosion distribution of oil and gas pipelines[J]. Engineering Failure Analysis, 2016, 60: 209-228. DOI:10.1016/j.engfailanal.2015.11.052 |
[9] |
BADIDA P, BALASUBRAMANIAM Y, JAYAPRAKASH J. Risk evaluation of oil and natural gas pipelines due to natural hazards using fuzzy fault tree analysis[J]. Journal of Natural Gas Science and Engineering, 2019, 66: 284-292. DOI:10.1016/j.jngse.2019.04.010 |
[10] |
TALEB-BERROUANE M, KHAN F, HAWBOLDT K. Corrosion risk assessment using adaptive bow-tie (ABT) analysis[J]. Reliability Engineering & System Safety, 2021, 214: 107731. |
[11] |
耿凯月. 海底油气管道全寿命周期风险评估研究[D]. 青岛: 中国石油大学(华东), 2019. GENG K Y. Study on risk assessment of submarine oil and gas pipeline in life cycle[D]. Qingdao: China University of Petroleum (East China), 2019. (in Chinese) |
[12] |
KAMBALIMATH S, DEKA P C. A basic review of fuzzy logic applications in hydrology and water resources[J]. Applied Water Science, 2020, 10(8): 191. DOI:10.1007/s13201-020-01276-2 |
[13] |
LI M, WANG D M, SHAN H. Risk assessment of mine ignition sources using fuzzy Bayesian network[J]. Process Safety and Environmental Protection, 2019, 125: 297-306. DOI:10.1016/j.psep.2019.03.029 |
[14] |
朱海. 基于关联规则Apriori算法的作业风险预警研究[D]. 长春: 吉林大学, 2014. ZHU H. The research based on Apriori algorithm of association rules in the operating risk early warning[D]. Changchun: Jilin University, 2014. (in Chinese) |
[15] |
MIWA M, BANSAL M. End-to-end relation extraction using LSTMs on sequences and tree structures[C]//Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics. Berlin, Germany: ACL Press, 2016: 1105-1116.
|
[16] |
张昱, 刘开峰, 张全新, 等. 基于组合-卷积神经网络的中文新闻文本分类[J]. 电子学报, 2021, 49(6): 1059-1067. ZHANG Y, LIU K F, ZHANG Q X, et al. A combined- convolutional neural network for Chinese news text classification[J]. Acta Electronica Sinica, 2021, 49(6): 1059-1067. (in Chinese) |
[17] |
谢腾, 杨俊安, 刘辉. 基于BERT-BiLSTM-CRF模型的中文实体识别[J]. 计算机系统应用, 2020, 29(7): 48-55. XIE T, YANG J A, LIU H. Chinese entity recognition based on BERT-BiLSTM-CRF model[J]. Computer Systems & Applications, 2020, 29(7): 48-55. (in Chinese) |
[18] |
徐文畅, 何文明, 游斌权, 等. 基于形态特征提取的急性下壁心肌梗死BiLSTM网络辅助诊断算法[J]. 电子与信息学报, 2021, 43(9): 2561-2568. XU W C, HE W M, YOU B Q, et al. Acute inferior myocardial infarction detection algorithm based on BiLSTM network of morphological feature extraction[J]. Journal of Electronics and Information Technology, 2021, 43(9): 2561-2568. (in Chinese) |
[19] |
黄冬梅, 王唱, 胡安铎, 等. 基于CNN-BiLSTM的潮汐电站潮位预测[J]. 水力发电, 2021, 47(10): 80-84. HUANG D M, WANG C, HU A D, et al. Tide level prediction for tidal power station based on CNN-BiLSTM network model[J]. Water Power, 2021, 47(10): 80-84. (in Chinese) |
[20] |
CHEN Y, ZHOU C J, LI T X, et al. Named entity recognition from Chinese adverse drug event reports with lexical feature based BiLSTM-CRF and tri-training[J]. Journal of Biomedical Informatics, 2019, 96: 103252. DOI:10.1016/j.jbi.2019.103252 |
[21] |
尹学振, 赵慧, 赵俊保, 等. 多神经网络协作的军事领域命名实体识别[J]. 清华大学学报(自然科学版), 2020, 60(8): 648-655. YIN X Z, ZHAO H, ZHAO J B, et al. Multi-neural network collaboration for Chinese military named entity recognition[J]. Journal of Tsinghua University (Science and Technology), 2020, 60(8): 648-655. (in Chinese) |
[22] |
SHAO T Y, LI X Y, ZHAO X, et al. DSKRL: A dissimilarity-support-aware knowledge representation learning framework on noisy knowledge graph[J]. Neurocomputing, 2021, 461: 608-617. DOI:10.1016/j.neucom.2021.02.099 |
[23] |
张祎, 孟小峰. InterTris: 三元交互的领域知识图谱表示学习[J]. 计算机学报, 2021, 44(8): 1535-1548. ZHANG Y, MENG X F. InterTris: Specific domain knowledge graph representation learning by interaction among triple elements[J]. Chinese Journal of Computers, 2021, 44(8): 1535-1548. (in Chinese) |
[24] |
ZHU Z W, ZHOU X H, SHAO K. A novel approach based on Neo4j for multi-constrained flexible job shop scheduling problem[J]. Computers & Industrial Engineering, 2019, 130: 671-686. |