2. 北京永新医疗设备有限公司, 北京 102206;
3. 中国人民解放军 91515部队, 三亚 572016
2. Beijing Yongxin Medical Equipment Co., Ltd., Beijing 102206, China;
3. No. 91515 Unit of PLA, Sanya 572016, China
放射性核素在社会生产生活中的应用广泛,若放射源管控失当,可能对公共安全造成巨大潜在威胁[1-2],给社会带来极大恐慌。放射性核素的监测识别是公共安全中不可或缺的监测预警手段,研究性能稳定、准确率高的放射性核素识别方法,可为早期发现并识别危险源提供有效的技术支持,对核安全应急具有重要意义。
传统寻峰算法通过计算得到放射性核素γ能谱的峰位,再与核素衰变产生的γ光子能量理论峰位进行匹配,来确定放射性核素的种类。该方法原理简单,计算高效。但是,在样品剂量率较低且测量计数时间较短的情况下,γ能谱没有形成明显峰位,导致峰位和峰面积的计算不确定度增加[3],给核素识别带来一定困难。另外,当探测器能量分辨率不高时,探测器记录下的能量事件可能发生温度漂移,不同核素的峰位会出现重叠,导致寻峰法对特征峰位相近的放射性核素识别的出错率较高。
近年来,“能谱特征信息提取+机器学习训练”给放射性核素识别提供了新的技术途径。任俊松等[4]将一维能谱数据变换为二维图像,利用奇异值分解提取特征作为支持向量机的输入训练分类器;Chen等[5]对能谱数据进行Karhunen-Loeve变换,将Karhunen-Loeve变换的系数作为神经网络的输入,训练人工神经核素识别分类器; 刘灏霖等[6]利用K-奇异值分解(singular value decomposition,SVD)算法构造稀疏字典,通过多种机器学习分类算法实现核素识别;He等[7]利用离散余弦变化对能谱进行特征提取,进而利用反向传播(back propogation,BP)神经网络开展核素识别。
许多学者将深度学习模型应用到放射性核素识别任务中。王瑶等[8]利用长短期记忆神经网络对两种放射性核素60Co和137Cs进行识别,平均识别率可达93.04%;胡浩行等[9]利用Geant4模拟了137Cs、60Co和152Eu 3种核素和部分混合核素共6类γ能谱,训练了卷积神经网络核素识别模型,模型的准确率在90%左右,证明了卷积网络具有更强的适应性和抗干扰性。Liang等[10]利用卷积神经网络对60Co、137Cs、238Pu和131I这4种核素进行识别,结果表明模型对低分辨、低计数能谱也能够很好识别,137Cs的γ能谱的识别率在90%以上,并可识别发生一定程度漂移的能谱数据。从上述研究中可得出:核素种类较少且能谱计数较高时,深度学习核素识别模型可以有效地进行区分识别;但在核素种类多、能谱计数较低时,深度学习核素识别模型的识别性能有待进一步提高。
基于端到端的学习方式,本文利用卷积神经网络,在0.5 μSv/h剂量率水平下,对16种放射性核素能谱及其双核素混合γ能谱开展识别分析研究。本文首先采集能谱数据,并创建γ能谱数据集;其次,搭建神经网络架构,开展模型训练;最后,提出一种低剂量率水平下快速准确且鲁棒性强的核素识别模型。
1 创建核素γ能谱数据集 1.1 能谱数据采集在剂量率约为0.5 μSv/h、测量计数时间约100 s的条件下,利用溴化镧能谱仪(能量分辨率在662 keV处约为5%)作为探测器采集了生产生活中常用的16种放射性核素的γ能谱数据,核素种类见表 1[11]。
种类 | 放射性核素 |
特殊核材料 | 233U,235U,238U,237Np,239Pu |
工业 | 241Am,133Ba,57Co,60Co,137Cs,192Ir,75Se |
医疗 | 131I |
天然 | 40K,226Ra,232Th |
将实测到的γ能谱数据作为原始数据,用于后续构建单核素和双核素γ能谱的训练数据集。
1.2 创建训练集为开展模型训练,需构建核素γ能谱数据集。以核素137Cs的γ能谱为例,说明能谱数据生成方法。
生成不同计数的放射性核素γ能谱。首先,利用式(1)对原始能谱进行积分归一化处理,可得到放射性核素衰变出的γ光子在不同能量下的概率密度。
$ \lambda_i=\frac{C\left(E_i\right)}{\sum\limits_{i=1}^{3000} C\left(E_i\right)} . $ | (1) |
式中:Ei表示能量值,keV;C(Ei)表示Ei能量下的计数。
通过计算得到的各个核素γ光子在不同能量下的概率密度,利用随机抽样的方式,抽取不同计数的核素γ能谱。
此外,由于探测器的工作温度对能谱数据有一定的影响,在不同的工作环境和工作时长下,探测器记录下的核素能谱数据会发生不同程度的漂移。能谱漂移是指探测器实测到核素的峰位能量与理论峰位能量的相对偏差。为增强模型的鲁棒性,使模型能够识别出峰位发生漂移的能谱,需生成发生不同程度漂移的能谱数据。通常,溴化镧能谱仪发生能谱漂移的最大程度约5%。因此,在-5%~5%能谱漂移区间内,生成放射性核素的γ能谱数据。图 1中展示了137Cs在不同程度峰位漂移下的能谱数据。
通过2个单核素γ能谱的能量概率密度对能量事件进行抽样,将2个核素的能量事件抽样结果按照能量区间进行计数统计,可以得到双核素的γ能谱。在创建双核素能谱数据的过程中,同时考虑了不同的能量事件抽样数目和能谱漂移程度,以增加双核素γ能谱数据的数量。
应急情况下,通常是对首要的单核素或双核素开展识别工作。本文针对16种单核素和双核素的γ能谱进行识别。16种放射性核素及其双核素混合γ能谱120种,共有136种γ能谱类型。通过抽取不同数量的γ光子事件并在不同漂移程度下,根据原始数据创建放射性核素γ能谱。其中,抽样生成的γ能谱总计数与核素采集能谱总计数比值范围为[0.75,10],能谱漂移范围为[-5%, 5%],每种γ能谱类型创建生成了1 100条能谱数据,共生成了149 600条γ能谱数据。最后,随机抽取80%的能谱数据用于模型的训练,其余20%的数据用于模型的交叉验证。
2 核素识别模型 2.1 卷积神经网络卷积神经网络(convolutional neural networks, CNN)相较于全连接网络(fully connected neural networks, FNN)有两点突出的优势[12]:1) 权值共享,CNN需考量的模型参数更少,可防止出现大量训练参数而导致过拟合的情况;2) 平移不变性,卷积核的输出响应只针对特定的特征,而不需要考虑特征的位置,这为γ能谱的识别提供了良好的解决方案,即使在发生峰位漂移的情况下,CNN也可以有效提取能谱的特征信息。卷积神经网络通常由输入层、卷积层、激活函数、池化层以及全连接层构成。卷积层可自动地进行特征提取。二维卷积计算公式为
$ \begin{gathered} \boldsymbol{S}(w, h, n)=\boldsymbol{I} * \boldsymbol{K}(w, h, n)= \\ \sum\limits_d \sum\limits_i \sum\limits_j \boldsymbol{I}(w+i, h+j, d) \boldsymbol{K}(i, j, d) . \end{gathered} $ | (2) |
式中:I为输出数据张量;K为卷积核;i、j、d分别表示卷积核横向、竖向和纵向3个方向的位置索引;S(w, h, n)表示经过w次水平和h次竖直方向平移后,第n个卷积核的计算输出结果。
为增加神经网络的非线性,通常需要利用激活函数进行非线性变换。目前,CNN中较为常见的激活函数为RELU,其数学表达式见式(3)。
$ f(x)= \begin{cases}0, & x \leqslant 0; \\ x, & x>0.\end{cases} $ | (3) |
RELU将部分卷积值归为0,增加了网络的稀疏性,有助于缓解模型过拟合的问题。此外,为降低CNN的映射特征对平移及其他变形的敏感度,通常需要池化层进行局部平均或者子抽样计算,常见的池化计算方式有平均池化和最大值池化。
分类问题中,CNN的网络架构顶层通常包含全连接层以实现不同的学习目的。最后,利用优化算法不断地更新模型网络参数,使模型能够达到较优的性能,进而完成相应分类任务的学习过程。
2.2 γ能谱数据分析实测能谱中能量范围为30~3 000 keV。由于噪声的存在,低计数γ能谱数据波动较为剧烈,因此考虑采用数据平滑方法对能谱数据进行预处理。本文采用移动平均法,滑动窗口大小设定为5,即每5个值取一次均值。图 2展示了放射性核素60Co的γ能谱在进行平滑处理前后的对比。
另外,相关研究表明,空间填充曲线可以降低CNN输入数据的维度,同时提高模型的泛化性[9]。因此,在研究二维卷积核对能谱特征识别分析能力时,可将一维能谱数据映射到二维空间中。本文利用numpy数据科学工具包提供的reshape函数,将3 000维向量转换为60×50的二维矩阵。图 3为放射性核素60Co的γ能谱经过幅值归一化后在二维空间上的数据分布。图中红色“”标记表示60Co 2个峰位的位置。二维数据分布有效降低了放射性核素特征峰位的位置敏感度,有助于增加CNN模型对γ能谱识别的鲁棒性并提升泛化能力。
2.3 CNN模型训练
本研究采用自搭建的CNN开展核素识别模型训练,网络架构如图 4所示,其中卷积模块由2个卷积层和1个池化层构成。利用n个卷积模块对输入数据进行特征提取,将计算得到的特征图数据进行全局平均池化处理。相较于将特征图直接转化为向量数据,全局平均池化层的好处在于可大幅减少模型的训练参数,降低模型的复杂度,有效防止模型过拟合。位于模型顶层的全连接层由1个隐含层和输出层构成,输出层的神经元个数为136,即单核素和双核素γ能谱类型总和。
模型的超参数对模型的性能有着至关重要的影响。本研究的核素识别模型有如下超参数需要提前确定:1) 采用卷积模块的数量;2) 卷积模块中卷积核的数量;3) 隐藏层的神经元个数;4) 隐藏层神经元训练过程中随机丢失率;5) 学习率。另外,还需确定卷积模块中池化层的计算方法,即采用最大值池化还是平均池化。
本文模型的超参数搜寻策略是采用随机抽样法获取超参数的值,进而对识别模型进行调控。下面以学习率取值为例,介绍随机抽样法获取超参数的原理和过程。首先,设定学习率的取值范围为[0.000 01, 0.01];其次,产生一个[0, 1]之间均匀分布的随机数ξ;最后,利用式(4)完成学习率的随机抽取。
$ \alpha=10^{3 \xi-5} \text {. } $ | (4) |
利用随机抽样法获取超参数的好处在于可以在大范围内获取超参数,并开展初步训练。通过观察训练结果,可以确定出较易收敛的超参数区域,进而缩小超参数搜寻区域,再进行抽样并察看模型的性能。这种由粗到细的搜索方式可保证识别模型匹配到一组较优的超参数。
本研究利用Keras-Tuner开源工具包开展超参数搜索。首先,确定各个超参数的取值范围,其中:卷积模块数量(conv_blocks)范围为[3, 5];卷积核数量(filters)为[32, 256];隐藏层的神经元数量(hidden_size)为[256, 512];隐藏层神经元随机丢失率(dropout)为[0, 0.5];学习率(learning_rate)的取值范围为[0.000 01, 0.01]。确定各个超参数的取值范围后,利用随机抽样法确定超参数,然后使用训练集开展一轮训练,并记录模型在验证集上准确率(val_accuracy)。
开展超参数搜索试验20次,将每次试验的超参数数值和模型效果进行统计记录,并绘制超参数平行图。图 5和6展示了CNN核素识别模型在不同超参数下初步训练后的准确率对比。图 6中:max表示最大池化计算;avg表示平均池化计算;None表示卷积模块数量小于4或5,该层不存在池化层计算。
通过超参数搜索寻优,最终确定采用卷积模块的数量为5,卷积核的数量依次为[96, 128, 32, 256, 256];池化层的计算方式依次采用[max, avg, max, max, max];全连接层中隐藏层的神经元个数为480,且训练过程中随机丢失率为0.3;最后,设定学习率为0.000 029 6。
确定出较优的超参数后,开展核素识别模型的训练。γ能谱数据样本的标签值以独热编码方式表示,输出层的神经元激活函数为softmax,并设定损失函数为多元交叉熵函数,其数学表达式为
$ L=-\sum\limits_{i=1}^{136} y_i^m \ln \hat{y}_i^m. $ | (5) |
式中:yim表示第m个样本在第i个维度的真实标签值;
核素识别模型的参数更新采用Adam优化器。该优化器性能较为稳定,是目前训练深度学习模型较为常用的一种优化器。对整个训练集迭代100次,完成对识别模型的训练。
3 模型识别结果分析 3.1 识别准确率分析为检验模型的识别准确度,控制核素产生的剂量率在0.5 μSv/h水平,利用溴化镧能谱仪采集核素γ能谱,以10 s为采样间隔,采集至120 s。本实验对9种核素241Am、133Ba、137Cs、131I、226Ra、232Th、57Co、235U和60Co及其双核素的γ能谱进行了数据采集,4台能谱仪共采集到1 333条γ能谱数据。
利用训练好的CNN核素识别模型,经过数据预处理后,对实测γ能谱数据进行识别。此处借用机器学习中分类模型的TopN准确率表征模型的识别性能。TopN准确率的定义为:对模型输出层计算结果降序排列,若前N个最大预测值与真实值相匹配,则认为分类识别成功。在对机器学习模型评价中,Top1和Top5准确率较为常见。Top1准确率展示了模型输出值中最大概率值与预期答案相匹配的能力;Top5准确率展示了模型输出值中前5个最大概率值与预期答案相匹配的能力。本文对1 333条γ能谱数据进行识别分析,分别统计了模型的Top1、Top3和Top5准确率,如图 7所示,CNN核素识别模型的Top1识别准确率为92.20%,Top3识别准确率为94.67%,Top5识别准确率为95.64%。
3.2 测量采集时间对识别的影响
为检验所建立的模型能否快速高效地识别出低剂量率能谱,需要在时间维度上考察模型的Top1识别准确率。在较短测量时间内,能谱峰位形成不明显,加之本底的干扰,识别较为困难。因此,要做到在低剂量率下快速识别,对模型的鲁棒性要求很高。
以133Ba和226Ra双核素的混合γ能谱为例,识别结果如图 8所示。在低剂量率且测量采集时间较短时,226Ra在610 keV附近的主特征峰尚且不够明显,分支比低的特征峰没有形成,这对核素识别造成一定困难。
为验证本实验所训练的CNN核素识别模型在时间上的识别能力,分别对测量采集时间为30、60和120 s的能谱进行模型识别分析,统计结果见图 9。能谱采集时间为30 s时,CNN核素识别模型的Top1准确率为90.11%;能谱采集时间为60 s时,模型识别的准确率提升至92.63%;能谱采集时间为120 s时,模型的识别准确率为92.98%。
从实验结果可以得出,在核素的剂量率约0.5 μSv/h、测量采集时间约60 s时,本文所研究的CNN核素识别模型的准确率为92.63%,识别准确率较高。
4 总结与展望核素识别是对放射性危险源监测预警的一项关键技术。本文利用自搭建的卷积神经网络进行核素γ能谱识别实验。首先利用溴化镧能谱仪实测了16种常见放射性核素的γ能谱,并且根据γ能谱中能量分布概率密度,随机抽样生成不同计数的双核素混合能谱,同时考虑到探测器温度漂移的影响,生成不同程度的能谱漂移数据加入训练集中。该模型克服了一些传统识别模型对能谱特征峰位置敏感的缺点[13],保证了模型识别的鲁棒性。
从实验结果来看,核素剂量率约为0.5 μSv/h、能谱采集时间60 s时,本文模型的识别准确率可达92.63%。另外,模型Top5识别准确率为95.64%,可满足对放射性危险源进行筛查监测的基本需求。
下一步工作可对模型的识别准确率进行进一步的提升,可尝试的改进方向包括:1) 对能谱本底进行扣除处理,因为低活度核素的能谱采集中本底的干扰不容忽视;2) 对能谱数据采用对数处理,再利用模型开展训练,对数处理后的数据能更好地突出能谱特征;3) 重组能谱道址,该方法可降低能谱数据的维度,且起到一定的数据平滑作用。
[1] |
周平坤. 核辐射对人体的生物学危害及医学防护基本原则[J]. 首都医科大学学报, 2011, 32(2): 171-176. ZHOU P K. The detriment of nuclear radiation on human and the protection principal[J]. Journal of Capital Medical University, 2011, 32(2): 171-176. DOI:10.3969/j.issn.1006-7795.2011.02.001 (in Chinese) |
[2] |
LI K, CHEN W H, LIANG M C, et al. A simple data assimilation method to improve atmospheric dispersion based on Lagrangian puff model[J]. Nuclear Engineering and Technology, 2021, 53(7): 2377-2386. DOI:10.1016/j.net.2021.01.032 |
[3] |
LIKAR A, VIDMAR T. A peak-search method based on spectrum convolution[J]. Journal of Physics D: Applied Physics, 2003, 36(15): 1903-1909. DOI:10.1088/0022-3727/36/15/323 |
[4] |
任俊松, 张江梅, 王坤朋. 基于SVD和SVM的核素识别算法[J]. 兵工自动化, 2017, 36(5): 50-53. REN J S, ZHANG J M, WANG K P. Radioactive radionuclide identification method based on SVD and SVM[J]. Ordnance Industry Automation, 2017, 36(5): 50-53. (in Chinese) |
[5] |
CHEN L, WEI Y X. Nuclide identification algorithm based on K-L transform and neural networks[J]. Nuclear Instruments and Methods in Physics Research Section A: Accelerators, Spectrometers, Detectors and Associated Equipment, 2009, 598(2): 450-453. |
[6] |
刘灏霖, 姚远程, 张江梅, 等. 基于K-SVD的γ能谱特征提取及核素识别[J]. 电脑知识与技术, 2018, 14(2): 177-179. LIU H L, YAO Y C, ZHANG J M, et al. γ Spectrum feature extraction and radionuclide identification by K-SVD[J]. Computer Knowledge and Technology, 2018, 14(2): 177-179. (in Chinese) |
[7] |
HE J P, TANG X B, GONG P, et al. Rapid radionuclide identification algorithm based on the discrete cosine transform and BP neural network[J]. Annals of Nuclear Energy, 2018, 112: 1-8. DOI:10.1016/j.anucene.2017.09.032 |
[8] |
王瑶, 刘志明, 万亚平, 等. 基于长短时记忆神经网络的能谱核素识别方法[J]. 强激光与粒子束, 2020, 32(10): 106001. WANG Y, LIU Z M, WAN Y P, et al. Energy spectrum radionuclide recognition method based on long short-term memory neural network[J]. High Power Laser and Particle Beams, 2020, 32(10): 106001. (in Chinese) |
[9] |
胡浩行, 张江梅, 王坤朋, 等. 卷积神经网络在复杂核素识别中的应用[J]. 传感器与微系统, 2019, 38(10): 154-156, 160. HU H H, ZHANG J M, WANG K P, et al. Application of convolutional neural networks in identification of complex radionuclides[J]. Transducer and Microsystem Technologies, 2019, 38(10): 154-156, 160. (in Chinese) |
[10] |
LIANG D J, GONG P, TANG X B, et al. Rapid radionuclide identification algorithm based on convolutional neural network[J]. Annals of Nuclear Energy, 2019, 133: 483-490. DOI:10.1016/j.anucene.2019.05.051 |
[11] |
IA EA. Identification of radioactive sources and devices: Reference manual[M]. Vienna: IAEA, 2011.
|
[12] |
盖荣丽, 蔡建荣, 王诗宇, 等. 卷积神经网络在图像识别中的应用研究综述[J]. 小型微型计算机系统, 2021, 42(9): 1980-1984. GAI R L, CAI J R, WANG S Y, et al. Research review on image recognition based on deep learning[J]. Journal of Chinese Computer Systems, 2021, 42(9): 1980-1984. DOI:10.3969/j.issn.1000-1220.2021.09.030 (in Chinese) |
[13] |
杜晓闯, 涂红兵, 黎岢, 等. 基于径向基神经网络仿真γ能谱模板库的核素识别方法[J]. 清华大学学报(自然科学版), 2021, 61(11): 1308-1315. DU X C, TU H B, LI K, et al. Radionuclide identification method based on a gamma-spectra template library simulated by radial basis function neural networks[J]. Journal of Tsinghua University (Science & Technology), 2021, 61(11): 1308-1315. (in Chinese) |