深度学习在图像处理领域的探究

发表时间:2020/9/17   来源:《科学与技术》2020年12期   作者:卓彬
[导读] 近年来,我国的各行各业的发展迅速,所谓深度学习主要是指通过构建深层级别的神经网络来模拟人脑进行分析
        卓彬
        (杭州海康威视科技有限公司 浙江省杭州市?310053)
        摘要:近年来,我国的各行各业的发展迅速,所谓深度学习主要是指通过构建深层级别的神经网络来模拟人脑进行分析,或者是模拟人脑进行学习以及解释相关数据信息。而图像识别是指通过对图像进行处理、分析及理解,进而实现识别各种不同模式的目标和对象的目的。如今深度学习已经被广泛应用于图像识别领域中,同时也获得了令人瞩目的成绩和效果。为此笔者在本文中就深度学习的概念以及结构优势进行探讨,同时也对深度学习在图像识别中的应用做出研究,希望可以为某些从业人员提供借鉴和参考依据。
        关键词:深度学习;图像处理领域;探究
        引言
        在信息时代下,数字图像成为最为常见的信息载体,可以说社会生产、人类生活中都已经充满了数字图像信息。信息技术的发展衍生出了大数据,让数字图像的产生速度、规模成几何形式增长,传统技术已经无法满足图像信息处理任务要求,社会更加迫切需要高效率、智能化的处理方案。对于图像处理来说,特征表达是重中之重,传统特征设计主要是人工完成,但由于过程十分复杂,对操作者自身要求非常高,所以自动化的高效图像处理是必然发展趋势。深度学习作为新时期的新概念,更多是在数据当中自动提取多层次特征信息,采用了数据驱动方法,通过相关的非线性转换,在原始数据中提取多层特性,让数字图像更具表达力、泛化力,从而满足图像处理高效性的发展要求。
        1问题分析
        尽管深度学习已经成为了图像识别方面的主要应用技术,但是它的发展并不完善,还存在很多问题需要研究者去解决。(1)理论模型不完善。基于深度学习的图像识别技术在国内发展时间相对较短,国内对于模型的构建还不完善,需要更多的理论研究。在之后的研究中,可以通过各种模型的组合,取长补短来构建合适的网络模型。(2)模型参数优化问题。基于深度神经网络的图像识别技术需要训练大量参数提取图片特征,这样就占用了大量的运行时间与计算机的存储内存。研究者应该改进模型结构,在保证图片识别的准确率的前提下提高模型的时间复杂度,优化模型参数。(3)训练数据优化问题。深度学习网络模型依赖大量的训练集进行特征提取,训练数据集不平衡甚至缺失,会极大的限制深度学习技术的应用。在以后的研究方向中应该考虑如何解决训练数据问题。(4)非监督学习的完善。对于有监督学习算法,需要训练数据进行大量的人工数据标注,浪费精力。之后的研究应该加强非监督学习算法的构建,解决数据标注问题。(5)对视频数据进行分类预测。目前,大多数算法都是基于静态图片数据进行处理分析的,对视频数据的处理较少。因此,加强对于视频数据识别检测的理论研究是一个重要的方向。
        2深度学习的深层结构优势
        深度学习的概念其实是来源于人工智能神经网络方面的研究,它在图像识别系统中的应用十分广泛,它属于一种包含多层感知器的结构,这也是它最大的优势。相关研究表明,如果针对特定任务的模型深度不够,就会增加所需要的计算单元,因而也就需要更多的参数和训练样本。此外,深度学习是基于大数据的自主学习过程,并不是通过手工设计来获得相关数据,即是通过组合低层来获得更加直观的表示方式,从而实现机器能够代替人类学习,其最终的目的是实现模拟人脑来进行一系列的学习活动,相当于机器模仿人类的一切学习活动[2]。由于深度学习从大数据自主学习可以获得良好的特征,因而可以起到提高图像识别系统性能的作用。
        3深度学习
        3.1发展背景
        在20世纪50年代,国外就提出了神经网络的概念,但由于当时缺乏网络训练算法理论、训练样本不足、计算机能力较差等影响,阻碍了神经网络进一步发展。新时期下,大数据、云计算等技术等到来,计算机性能得到了大幅度提升,延缓了训练低效性,大幅度增加训练数据可以有效降低拟合风险,根据无监督逐层训练策略和BP算法,让深层神经网络训练成为可能,这也让人们开始重点关注深度学习。本质上深度学习模型就是深层的神经网络。

整个系统为多隐层堆叠,每层都要处理上一层的输出信息,将初始输入、输出关系不大的数据,转变为更加紧密的数据关系,这样最后一层输出映射难以完成的任务成为可能,我们也可以将这种学习模式称之为“特征学习”。
        3.2卷积神经网络架构
        图像识别作为深度学习最早尝试的方式,其中最为重要的就是卷积神经网络。卷积神经网络可以分为三个层级堆叠,包括卷积层、池化层、全连接层,不同层次有着不同的特性和作用。(1)卷积层。主要负责提取数据特征,通过输入特征图X以及K个二维滤波器,通过卷积运算输出K个二维特征图。卷积运算具有很大的优势,首先可以提取相邻像素间的局部关系,其次是可以对图像进行平移、旋转、尺度等变换具备一定鲁棒性。(2)池化层。负责对卷积层输出结果进行处理,压缩所输出的特征图,这样可以降低特征图体积,减少网络计算复杂性,同时能够让特征图更加精简,有助于提取主要特征,降低特征表达维度,还能够对针对较小平移、变形具有鲁棒性。(3)全连接层。负责将所有特征连接起来,并将最终的连接结果(输出值)传输给分类器。
        3.3神经网络的优化
        在科学技术不断发展中,神经网络模型层数也越来越深,增加了训练数据集,模型内部结构也变得十分复杂。网络训练当中通常都会涉及拟合、梯度消失、梯度爆炸等问题,因此相关学者也针对性提出了几种神经网络的优化方法。首先,dropout优化技术。该项技术能够在深度学习网络训练当中,对神经网络单元按照相关概率将其从网络中暂时丢弃。这种丢弃是暂时性的,因此在使用随机梯度下降方法训练网络中,不同批量数据都在训练不同网络。该项技术在很大程度上打破了节点之间的关联性,提高了网络学习的泛化性,避免出现过度拟合等问题。其次,批量标准化(BN算法)。Google在2015年提出了BN算法理论,可以对深层次神经网络训练。BN算法能够规范所有层或某些层的输入,固定每一层输入信号均值和方差,这样即可避免出现梯度消失或梯度爆炸等问题。
        3.4网络结构局部修改
        AlexNet发展下也衍生出了VGGNet网络。相比最初的AlexNet网络,VGGNet网络采用了多个小型卷积核串联得加替换一个大型卷积核的方式。这样不仅不会影响卷积效果,还增加了很多非线性操作,在网络中提取更多、更丰富特征,减少了其中的参数量。VGGNet网络也证明了网络层次越深、特征越丰富,所得到的图像识别效果越好。NIN网络再次对卷积核做出了调整,将单一线性卷积核转化为多层感知机MLP。CNN高层特征主要是由低层特征多种运算组合得到的结果,非线性运算组合可以让高层特征更具泛化性。MPL卷积核让NIN中一次卷积操作相当于之前多个卷积核操作的结果,所以在NIN网络中可以用较少层数实现更深的网络图像识别效果。
        结语
        综上所述,深度学习如今已经被广泛应用于各行各业,也取得了令人瞩目的成绩和效果,尤其是在图像识别领域中的应用更是效果显著。深度学习主要是指学习样本的内在规律以及表示层次,而它最终的目标主要是为了让机器能够像人一样具有分析和学习的能力,能够精准地对文字、图像和声音等数据进行识别,同时深度学习还是一个相对复杂的机器学习算法。因此本文就深度学习在图像识别中的应用进行研究,主要分析了它的深层结构优势以及应用范围,最终的目的是为了推动图像识别领域快速发展。
        参考文献
        [1]张曰花,王红,马广明.基于深度学习的图像识别研究[J].现代信息科技,2019,3(11):111-112+114.
        [2]徐政超.基于深度学习的图像处理技术[J].数字技术与应用,2019,37(05):222+224.
        [3]郑远攀,李广阳,李晔.深度学习在图像识别中的应用研究综述[J].计算机工程与应用,2019,55(12):20-36.
        [4]孟令,朱正,林世忠,等.浅谈深度学习在图像识别领域的应用现状与优势[J].电工技术,2018(16):145-146+149.
投稿 打印文章 转寄朋友 留言编辑 收藏文章
  期刊推荐
1/1
转寄给朋友
朋友的昵称:
朋友的邮件地址:
您的昵称:
您的邮件地址:
邮件主题:
推荐理由:

写信给编辑
标题:
内容:
您的昵称:
您的邮件地址: