何敖东
上海赫千电子科技有限公司 200125
摘要:本文提出一种基于局部平均预处理的交通标示识别方法,通过将RGB图像转化为 YUV通道并只取Y通道图像进行局部平均预处理,再进行图像增强后进行训练,将传统模型与本文提出的网络模型进行对比。结果表明,本文提的网络模型参数量仅为对比传统网络模型的9.0%,但测试集的识别精度与传统的卷积网络获得识别精度相当。
关键词:交通标志、局部平均、深度可分离卷积
0 引言
在汽车的辅助驾驶过程中,通过对交通标志的识别,给智能汽车提供道路上的交通信息,指引智能汽车按照交通规则行驶。目前的交通标志识别方法主要分为基于机器学习的方法和基于深度学习的方法 [1]。但现阶段,现有交通标志识别算法尽管获得较高的识别精度高,但是运算量大,对硬件要求高[2-3]。针对现有算法的不足,本文采用基于局部平均预处理的交通标志识别算法,对卷积神经网络模型结构进行改进,以降低模型训练的硬件配置。
1. 数据集和预处理
1.1 数据集
本研究使用德国交通标志识别的数据集(GTSRB数据集)进行训练和模型测试,该数据集中存在43个类别的交通标志。训练数据有34799个,验证数据有4410个,测试数据有12630个,图像的大小为32 x 32 x3。训练数据中每个类别的样本数量有较大差异,因此,对类别的样本数进行数量均衡处理,经过样本均衡后样本数量总数为50690。
1.2. 预处理方法介绍
将输入的尺寸缩小为32×32×3的图像。在训练时,我们忽略交通标志图像的颜色差异,而只考虑图像的不同部分的亮度差异。因此,将RGB色彩空间转化为YUV色彩空间,并且只取Y通道的图像,通过采用这种方式,能够使得从图像原来的三通道图像变成了一个通道,减少了训练数据量,如图1a所示,图1a为原图经过转化后的Y通道的图像。
为了克服因图像变化导致照明条件的变化从而使得图像的成像图像相同对交通标志识别的准确率影响,在Y通道的图像的基础上进行局部平均预处理变化,具体为:使用(3×3)固定大小的窗口,在图像像素中选取与(3×3)窗口相同的尺寸的像素;在(3×3)窗口相同的尺寸的像素中,求解(3×3)窗口的所有像素的平均值,然后将(3×3)窗口的像素值分别与平均值进行比较,如果像素值大于平均值,则将像素置255,反之,如果像素值小于平均值,则将像素置0;用(3×3)窗口遍历图像的所有像素并且重复上述步骤,获得最终的局部平均图像,如图1d所示。对获得的图像进行归一化处理获得最终的训练图像。
为了避免外界环境变化对交通标志的成像造成不同的变化,在模型训练时,图像旋转角度最大范围为10度,最大随机放大倍数为1.2,最大随机水平偏移0.08和上下偏移的范围为0.08。
2 试验方法
2.1 网络模型
本文采用以Mobile Net[4]提出的深度可分离卷积为基的卷积替换传统的卷积层,以降低参数量。采用的深度可分离卷积模型结构共为16层,包括6个深度可分级卷积层、4个BN层、3个池化层、2个全连接层、一个舍去层,模型结构的网络参数参为171668个。为了验证模型的有效性,本文还采用传统卷积网络模型作为对比,该模型采用2个卷积层、2个池化层、2个全连接层、2个舍去层,网络模型的参数量为2121643个。比较二者的网络参数量,本文采用的深度可分离卷积的网络模型的参数量仅为传统卷积模型的9.20%。网络训练时损失函数采用交叉熵,优化器采用adam,batch size大小为256。
3. 结果和分析
模型的训练结果如图1b、图1c、图1e、1f分别本文采用以深度可分离卷积为基础的网络模型以及传统卷积的网络模型的损失值和训练精度随着迭代次数的增加变化关系。图中显示深度可分离卷积的网络模型与传统的卷积网络模型表现出略微不同的趋势。初始时,传统卷积的训练集的损失值下降趋势小于验证集,训练集的精度同时也小于验证集,随着训练次数的增加,测试集和验证集的准确率大概在训练10次后就急剧提升,损失值急剧下降,随着次数增加,损失值和精度的变化趋势趋于平稳。但深度可分离卷积中,无论是损失值还是精度,训练集和验证集表现出相同的趋势,如图1b和图1c所示,而且模型在某些批次存在波动,说明图像识别中某些批次的图片存在较大差异。采用基于深度可分离卷积的网络模型参数量尽管只有传统卷积模型的9.20%,但是其损失和精度并未有降低。选择验证集最好的条件结果作为最终的网络模型参数,深度可分离卷积模型中训练集的精度为98.9%,验证集为98.5%,测试集为97.5%。传统卷积模型中训练集的精度为98.1%,验证集为99.1%,测试集为98.0%,可见,从测试集显示的结果看出,采用改进的深度可分离卷积模型与传统的卷积模型的精度的并未发生改变,但是模型的网络参数量极大减少。
4. 结论:
本文提出一种基于深度可分离卷积的网络模型用于对交通标示进行识别,结果表明,尽管本文提供的网络模型参数量只是传统模型的9.0%,采用改进的深度可分离卷积模型与传统的卷积模型的识别精度并未降低,但是模型的网络参数量极大减少。
参考文献
[1].马永杰, 李雪燕, 宋晓凤. 基于改进深度卷积神经网络的交通标志识别[J]. 激光与光电子学进展. 2018-07-15.
[2].Cristianni, N,shawe-Taylor J. An introduction to support vector machines and other kernel-based learning methons[M]. New York: Cambridge University Press,2001:1-28.
[3].Ciresan D, Meier U, Masci J, et al. Muiti-column deep neural network for traffic sign classification[J]. Neural Networks,2012,32:333.
[4].HOWARD A. Searching for mobile NetV3 [C].2019 IEEE/CVF International Conference on Computer Vision(ICCV),Seoul,Korea(South),2019:1314-1324.
[5].作者姓名:何敖东
[6].性别: 男
[7].学历:本科
[8].籍贯:贵州
[9].出生年月:1983年4月
[10].现有职称:工程师
[11].研究方向:智能网联汽车