王雯婕
华中师范大学物理科学与技术学院 湖北省武汉市 430079
摘 要:在高能物理实验中,核脉冲探测无论在基础研究还是在实际应用中都是很重要的。由于探测器系统的指数信号和随机噪声的存在,传统的曲线拟合方法不足以达到最佳的精度和效率。近年来,神经网络被逐渐应用于高能物理实验的数据分析中,由于神经网络算法计算量大,为满足快速实时处理数据的需求,我们用嵌入式的方法。为解决传统方法存在的问题,本项目研究了基于边缘计算的多通道核脉冲特征参数实时提取系统,采用降噪自编码器的对脉冲序列进行去噪和特征提取操作,采用全连接回归网络对幅度时间参数进行提取和预测,最终运用FPGA平台或AI-BoxX Gen.1(WHL-U+HDDL-R8)开发板实现设计内容。
关键词:边缘计算、深度学习、核脉冲参数预测、降噪自编码器、回归网络
1项目背景
1.1研究背景与意义
高能物理学是一门以实验为基础的学科,其实验内容包括用各种加速器产生很高能量的粒子束并且研究这些粒子。新的粒子加速原理和新的粒子探测手段的出观,将是意义深远的。探测器探测粒子的信息,并将信息经过读出电路转换成数字信号存储在数据中心。在获取的信号中,除了感兴趣的信号以外,还存在着更多的本底。为了区别信号与本底,研究感兴趣的物理现象,需要从探测器获取粒子的时间、位置和能量信息。随着数字化探测系统的发展,使用数字信号处理算法处理获得的脉冲信号,估计脉冲幅度及时间信息得到广泛的应用。
1.2国内外研究现状
国内外许多高校和研究机构对提取脉冲时间参数都进行了研究和实现,对于神经网络方 法也有许多研究成果,但在使用神经网络在线实时提取脉冲参数这一问题缺少研究和实现。传统的模型拟合技术是用曲线拟合的方式来提取脉冲的特征参数,其主要目的是寻找两个或多个变量之间的参数化数学关系。
在从成形脉冲中提取时间和幅度信息过程中,由于探测器系统的指数信号和随机噪声的 存在,使得传统的曲线拟合方法不足以达到最佳的精度和效率,而且传统的方法只能提取出 一个参数。而在下一代对撞机的升级中,高精度,高亮度是主要发展方向,由此带来的高数据量也是对数据处理的挑战,实时预处理数据是减少离线数据存储量的一种方法。为此,本课题研究了基于 ADC 的探测器实现时间和幅度序列核脉冲的时间参数实时提取,采用基 于降噪自编码器的深度网络对脉冲序列进行去噪和特征提取操作,通过嵌入式平台实现这一目的。
2项目设计方案
2.1整体网络结构
本项目的主要研究目标是在嵌入式开发平台上实现在线实时预测脉冲信号的幅度和时间参数。为实现这一目标,我设计出了包含以下几部分的整体网络结构:
(1)数据生成。可先用随机参数进行实验,在测试演示阶段,实际数据的来源通过实验已有的ADC板卡送入数据到嵌入式开发平台中,来测试和评估系统的性能。
(2)改进型的降噪自编码器。该算法是一种用于脉冲参数估计的算法,在深度学习网络中降噪自编码器模型的基础上进行了改进和调整,使其实现估计脉冲参数的功能。
(3)全连接的回归网络。通过训练回归网络,拟合出确定函数和映射关系,实现对脉冲信号时间和幅度信息的预测。
(4)系统性能评估。通过预测值和标签值对比,利用高斯拟合,拟合出方差,并将方差作为评估标准。
2.2 数据的生成和处理
本项目通过随机生成参数,参数类型为浮点型,代表脉冲的幅度和时间。将参数输入到脉冲函数中,生成数据,然后加入噪声,因为实际情况中往往是有噪声的。将加噪后的数据,加噪声前的数据和随机生成的标签保存起来,取30000条数据作为训练数据,取5000条数据作为测试数据,来训练和评估基于神经网络的脉冲参数提取的系统。在测试演示阶段,实际数据的来源通过实验室已有的ADC板卡送入数据到嵌入式开发平台中,来测试和评估系统的性能。
2.3降噪自编码器设计方案
降噪自编码器采用4层卷积层和解卷积层结构,目的是从加噪的输入数据中恢复原始数据。
卷积层的主要功能是特征提取,通过卷积核对输入图像的卷积运算,强调我们感兴趣的特征,以达到特征提取的目的。解卷积又称为转置卷积,其运算操作与卷积相似,是一种特殊的卷积操作。
在 DAE 网络中,网络通过从破损样本数据中学习原始数据,能够学习到样本数据分布 中感兴趣的结构。在脉冲时间幅度任务中,为了从复杂的信号中提取脉冲参数,需要先从复杂信号中获取原始信号,这些信号包含我们感兴趣的粒子信息。DAE 网络正是一种用来去除干扰信号,捕捉有用信号网络模型。获得有用信号后,实现脉冲时间幅度估计需要对有用信号进行回归。
2.4回归网络设计方案
本文设计的回归网络包括三层,其中有两个全连接层和一个输出层。回归网络的目的是,根据输入数据与标签,学习数据分布特征。从数学角度来说,回归网络就是在拟合输入数据(去噪后)与标签之间的函数关系,从而实现回归任务。而在这个项目中,我们期望得到的是脉冲的幅度和时间信息,所以我们回归网络的输出包括这两类数据。
我们的设计的全连接层主要完成两个计算,首先是一个线性计算,将上一层输出的特征数据以矩阵相乘的方式展开;然后,线性计算的结果会通过一个非线性的激活函数。从实际意义来理解全连接层,全连接层经过学习之后能够实现对目标函数的拟合。
2.5系统性能评估
在这个项目中,我们将得到的回归预测值与真实值进行对比,通过高斯拟合来拟合出均值和方差,用方差作为系统的评估标准。用所有测试样本的预测值和真实值之差的方差,来度量时间和幅度分辨率。分辨率越低,表示回归网络的性能越好。
对于降噪自编码器的性能评估,我们将加噪声后的数据通过DAE之后的输出和未加噪声之前的数据进行对比,可以评估出降噪自编码器从加噪信号中恢复原始信号的能力。
3项目特色与创新点
该项目关键在于深度网络中的降噪自编码器和回归网络的设计与实现,并且结合了边缘计算的思想。项目特色与创新点如下:
1、在编码器层和解码器层中,我们使用卷积和解卷积操作来替换全连接层。
2、卷积层和解卷积层跳跃连接。
3、在回归网络中我们使用的是Leaky RELU激活函数。有效避免了梯度消失或梯度爆炸问题以及ReLU激活函数会出现的神经元的死亡问题,且计算速度快。
4、利用边缘计算的方法,能够大幅度减少服务器的计算压力,并且处理起来更灵活多变,管理成本更小,网络流量小,还有更高的应用程序运行效率的特点。
5、本项目可以在线实时处理数据和同时估计脉冲时间和幅度参数的神经网络结构,将其移植到嵌入式系统中,具有代码固化、低功耗、高稳定性、专用性强等优点。
4结束语
本文就基于高能物理实验中探测器探测粒子信息这一环节,希望通过边缘计算、深度学习的方法处理获得的脉冲信号,通过搭建神经网络,实现多通道实时预测脉冲信号的时间和幅度信息。为实现这一目标,文中研究了在深度学习网络中降噪自编码器模型的基础上进行了改进和调整后的4层卷积层和4层解卷积层DAE网络,作为脉冲参数估计的算法,使其实现估计脉冲参数的功能。还设计了3层全连接的回归网络,通过训练回归网络,拟合出确定函数和映射关系,实现对脉冲信号时间和幅度信息的预测。最终通过预测值和标签值对比,利用高斯拟合,拟合出方差,并将方差作为系统性能评估标准。
参考文献:
[1]杜东生,杨茂志. 粒子物理导论第2版[M].科学出版社,2019:2.
[2]尹儒英.高能物理入门[M].四川人民出版社,1979:72.
[3]谢一冈,陈昌等.粒子探测器与数据获取[M].科学出版社,2003:463
[4]崔向丽.基于神经网络的高能物理粒子鉴别的应用研究[D].兰州大学,2013.