基于卷积神经网络的深度线段分类算法--中国期刊网

字体：大中小

首页> 原创作品> 正文

基于卷积神经网络的深度线段分类算法

发表时间：2020/4/28 来源：《科学与技术》2019年第22期作者：潘红岩

[导读] 为解决单目图像中冗余像素点不利于深度神经网络快速完成深度信息检测的问题

        摘要：为解决单目图像中冗余像素点不利于深度神经网络快速完成深度信息检测的问题，提出一种基于卷积神经网络的深度线段分类算法。对ＮＹＵ-Ｄｅｐｔｈ数据集使用线段检测算法进行线段检测得到原始图像的线段特征图。通过数据预处理结合深度数据得到表征深度信息的线段集合及其标签，提出适用于线段特征的卷积神经网络，实现单目图像中深度线段的分类。本论文从不同方面阐述基于卷积神经网络的深度线段分类算法，希望为研究卷积神经网络的专家和学者提供理论参考依据。
        关键词：卷积神经网络；深度线段分类；算法
将图像某种特征属性归类到预先设定的类别中是图像分类的主要依据,图像分类涉及到特征提取与分类算法两大块。传统的图像分类算法过于依赖人的经验,但由于图像信息具有不可描述性和复杂性,以及人类感知的高层语义信息与图像的底层表达特征之间存在巨大落差,导致了传统算法的局限性。以卷积神经网络算法为核心的深度学习,不需要依赖人工经验进行手动设计特征提取,通过有监督学习合理地改变网络深度完成特征学习,从而得到更加全面直接的图像类别信息,继而更加精确地对图像进行分类识别。
1深度卷积神经网络
        依靠人工经验提取样本的特征数据是浅层模型的思想所在,因此特征数据的提取决定了整个图像分类算法的复杂度和精确度。比较典型的浅层机器学习有最大熵法、逻辑回归、随机森林（RF）、Boosting等,这些算法为了对浅层模型进行研究,需要不断地人工对样本数据进行反复摸索,同时由于浅层学习输入层和输出层之间只含有较低的模型层数,不能很好地解决非线性问题,研究进度受人的主观因素影响大,具有不可扩展性。
        卷积神经网络由卷积层和池化层交替叠加构成[9].由上层特征图和卷积核通过卷积运算得到的特征图构成了卷积层；对每个特征图进行尺度缩小即对特征图进行下采样就是池化。卷积神经网络模型（CNN）如图 1所示:

图 1 卷积神经网络模型
图 1 中,C1、C2 为两个卷积层,S1、S2 为两个池化层,黑白交替的方框则代表提取到的类型各异的特征图.每个池化层前面都连接一个卷积层,卷积层通过对上一层输出图像进行卷积滤波；池化层则对特征数据进行下采样.最终输出层（output）连接分类器,输出不同类型分类的概率,概率最大对应的 Label则为图像分类结果。
2数据预处理算法
2.1线段过滤算法
        首先利用直线检测算法对图像进行线段特征提取，图像中深度信息显著的线段占有较小比例，会造成严重的数据不均衡问题。针对该问题设计图像中的线段过滤算法是非常有必要的，线
段的特性主要有长度、角度、粗细等信息、经试验对比将线段长度作为设计线段过滤算法的主要因素。线段过滤算法如下:
（1）对于每一张图像经过线段检测算法提取到所有的线段特征Ｓ(ｎ)；
(２)计算图像的高和宽ｈ，ｗ，初始指定线段保留数目为ｋ；
(３)当Ｓ(ｎ)的长度大于ｋ时，根据端点数值计算每条线段的长度；
(４) 对于线段端点值超过图像像素边界值的点，使用像素边界值进行替换；
(５)将计算出的所有线段长度数值进行从大到小排序；
(６)选择长度数值排在前ｋ名的线段；
(７)不断优化ｋ值，直至结果最优，送入网络作为输入；
2.2数据标签制作算法
        由于提取到的线段坐标为浮点数，而原始的深度信息是根据图像像素值进行对应保存的，且再深度信息的采集中丢失了许多几何特征信息。所以原始图像与深度图像不能得到完全的对应，线段特征与深度信息的一致性就更加困难了，对线段的每个端点划定一个2 2的矩形区域。将两个端点对应矩形区域内求取 1６组相对深度值，将这１６组数值进行比较选取相对深度最大的值作为该条线段的相对深度。由于在数据集中含有室内、室外等不同场景。每幅图像的深度数据范围不同，如卧室和道路又极大的深度范围差异，故不能定义一个全局深度阈值来划分深度线段和非深度线段。在本研究中，首先计算每幅图像的深度数据平均值再根据试验结果分配权重设定阈值定义标签。
2.3线段检测方法(ＬＳＤ)
ＬＳＤ是直线检测常用的算法之一，其原理是像素合并与误差控制，在直线检测过程中，该算法首先计算每一个像素与水平线的夹角，对其进行伪排序。合并这个场里方向近似相同的像素。这样可以得到一系列候选区域，这些候选区域被称为线段候选区域，每一个线段候选区域其实就是一组像素，作为直线段的候选区域，对于每个直线段候选区域。我们可以观察它的最小外接矩形，当这一组像素构成的区域比较细长时，那么这组像素更加可能是直线段。线段候选区域中若一个像素的水平线夹角角度与最小外接矩形的主方向的角度差在容忍度一定范围内，这个点就是同性点，统计最小外接矩形内的所有像素数和同性点点数，用来判定这个线段候选区域是否是一个直线段，然后根据目标的几何特征设计快速算法以快速确定疑似目标区域。
        总之，卷积神经网络模型可以有效改善深度估计问题中现有深度学习算法不能得到精确边界问题。该模型可对深度线段进行分类，分辨出清晰的物体边界。在ＮＹＵ-Ｄｅｐｔｈ数据集上进行了线段卷积试验。结果表明在200条线段的图像中深度线段分类准确度达到了73.50％。该模型可以有效检测出深度线段。根据线段分类的结果加强深度图像的边界信息，有利于更好的完成图像深度信息检测任务。
参考文献：
[1]基于成长型神经网络以线段为基元的曲线重建[J]. 王世东,张佑生,王焕宝. 工程图学学报. 2010(06)
[2]基于图像分割的线段检测方法[J]. 张博,沈希忠. 上海应用技术学院学报(自然科学版). 2014(04)
[3]线段提取在高分辨率遥感图像建筑物识别中的应用[J]. 汪行,陈学佺,金敏. 计算机辅助设计与图形学学报. 2005(05)
[4]线段树在程序设计中的应用[J]. 林盛华. 大众科技. 2005(04)
[5]如何求一组线段的交点[J]. 罗光宣,晓海. 电脑爱好者. 2001(16)
[6]线段的倍画法[J]. 李玉兰. 职业技术教育. 1995(08)
[7]AutoCAD中斜线段的绘制要点及技巧[J]. 陆素梅,吴宝伟. 职业. 2016(12)
[8]一种小线段平滑过渡轨迹控制算法的实现[J]. 林峰,郑力新. 成都大学学报(自然科学版). 2015(03)