基于深度学习的遥感图像目标检测方法--中国期刊网

字体：大中小

首页> 原创作品> 正文

基于深度学习的遥感图像目标检测方法

发表时间：2021/3/29 来源：《城镇建设》2021年1期作者：张珺

[导读] 遥感数据日益多元化，数据获取的速度加快

        张珺
        宁夏回族自治区自然资源信息中心，750002

        摘要：遥感数据日益多元化，数据获取的速度加快，更新周期缩短，时效性越来越强，极大的促进了遥感影像相关的应用研究。传统的遥感影像目标识别主要是基于人工提取特征的方法，但遥感图像中丰富多样的细节信息使得人工描述的单一特征不足以全面表达目标地物，且多依赖于专家经验。此外，建立在概率统计基础上的机器学习通常需要复杂的特征描述，并且基于其浅层的网络结构学到的特征表达在处理复杂的目标检测问题时表现性能及泛化能力有明显不足。
        关键词：遥感;深度学习;目标检测;

        遥感图像目标检测作为航空卫星图像分析领域中一个基本但具有挑战性的问题，近年来受到了广泛的关注。随着遥感图像分辨率不断提高，遥感影像具有数据量极大、数据复杂等特点，这使得传统的遥感影像目标检测技术难以满足现状需求。随着人工智能的发展，基于深度学习的目标检测技术在遥感影像中的应用越来越广泛，利用深度神经网络从计算机视觉角度提取遥感影像信息，能够极大提高高分辨率遥感影像目标检测精度，已经成为遥感领域当前研究的热点。
        2000年以后随着计算资源大规模提高，基于人工神经网络的深度学习方法蓬勃发展。深度神经网络能够通过大量的训练数据及具有隐藏层的深度学习模型学习高维特征，提高了目标检测的分类精度。深度学习的深层结构及特征学习能力在图像处理领域取得了巨大的成功，大量学者也将其运用到遥感目标检测与识别领域。本文对当前深度学习应用于遥感图像处理的方法进行对比分析，有助于追赶深度学习的发展步伐，帮助研究人员更好的了解这一研究领域。
        1 基于深度学习的遥感图像目标检测方法
        遥感图像目标检测方法包括基于区域提议方法和基于回归的方法，基于区域提议的方法先生成一系列目标候选框，然后再利用卷积神经网络对目标进行分类与边框回归，具有高精度的优点。本文主要对基于区域提议的目标检测进行分析与对比。
        1.1 R-CNN。
        2014年，Girshick使用“区域提议+卷积神经网络”的方法代替传统目标检测使用的“滑动窗口+手工设计特征”方法，设计了R-CNN框架，使得目标检测技术取得了巨大突破。R-CNN利用选择性搜索算法在输入图像中提取约2000个候选区域；然后将每个候选区域缩放为固定大小后送入模型中提取特征向量；最后把特征向量输入一组多类别支持向量机对每个候选区域进行分类与候选框精修。R-CNN的处理过程如图1所示。虽然R-CNN方法相较于传统方法进步巨大，但其重复计算提取特征造成了效率低下。

        图1 R-CNN检测流程
        1.2 Fast R-CNN。
        为了提高目标检测的效率及精度，SPP-net去掉了R-CNN缩放候选区域以统一图片尺寸的处理方式，在CNN结构中加入了空间金字塔池化层使得任意尺寸的图像输入网络可以输出固定维数的特征向量。Fast R-CNN采纳了类似方法，增加了类似空间金字塔池化层的Ro I池化层，对输入全连接层的特征向量尺寸进行归一化处理。另外，SPP-net与Fast R-CNN对输入图像只进行一次卷积特征提取也大大缩短了计算时间。Fast R-CNN的处理过程如图2所示。虽然这一改进提高了速度，但是仍然沿用选择性搜索算法获得目标候选框的方式也严重制约其效率。

        图2 Fast R-CNN检测流程
        1.3 Faster R-CNN。
        2017年，Ren等人在Fast R-CNN的基础上提出了Faster R-CNN，采用区域提议网络取代选择性搜索算法生成目标候选框，并与Fast R-CNN结合形成了一个端到端的卷积神经网络目标检测模型。其中区域提议网络仅需通过一次卷积操作提取目标候选框及特征图，并且进行了两次候选框精修与分类，在效率与精度方面都得到了很大的提升。Faster R-CNN的处理过程如图3所示。

        图3 Faster R-CNN检测流程
        1.4 Mask R-CNN。
        Mask R-CNN算法是在Faster R-CNN的基础上添加了一个额外的掩码分支与现有分支并行来预测用于包围框检测的目标掩码。Mask R-CNN采用“Res Net+FPN”的主干网络结构，将低层次特征与高层次特征结合，适用于多尺度目标的检测。此外还将Ro I池化层替换为Ro IAlign层，在下采样时对齐特征以减少多量化引起的误差对回归定位产生的影响。Mask R-CNN的处理过程如图4所示。

图4 Mask R-CNN检测流程
2 评价指标
遥感图像目标检测方法常用的评价指标包括精确率(Precision)、召回率(Recall)、平均精度(AP)、F1-score等。

        上式中，P指精确率Precision;R指召回率Recall。
        3 遥感图像数据集
        数据集对于深度学习目标检测方法非常重要，具有较强适应性的数据集能够促进遥感图像目标检测技术的发展。在过去的几十年中，多个研究小组发布了公开的遥感图像数据集。表1中介绍了流行的遥感图像数据集相关信息。

4 结论
        随着遥感图像目标检测需求的不断增长以及计算机技术的发展，极大地促进了深度学习在遥感图像目标检测领域的应用研究。目标检测算法日新月异，遥感图像目标检测与识别任务仍面临着诸多挑战。
        (1）遥感图像目标具有尺度差异性，目前大多采用融合多层特征的方式来获取多尺度特征以优化小目标及密集目标的识别效果，但目前仍旧缺乏适合遥感多尺度目标检测的性能更优异的方法。
        (2）由于大量的遥感标注数据耗费巨大获取不易，缺乏有效的训练集也是制约目标检测精度提升的瓶颈，因此采用弱监督、无监督的方法，或利用迁移学习解决数据不足的问题也是今后发展的趋势。
        (3）遥感数据是多模态的，特定数据集针对特定任务的难以迁移问题也是面临的挑战之一，因此利用多源异构数据和信息的融合，协同互补地利用这些数据源构建易迁移的通用模型十分重要。
        (4）虽然理论上多层网络确实可能学习出最优的函数模型，但它无法解释该模型如何构建以及模型背后的含义。加强网络的理论研究并掌握最佳网络深度与检测性能、硬件、效率之间的平衡也是今后重要的研究课题之一。
        参考文献
        [1]李德仁，张良培，夏桂松.遥感大数据自动分析与数据挖掘[J].测绘学报,2014,43(12):1211-1216.
        [2]龚健雅,季顺平.从摄影测量到计算机视觉[J].武汉大学学报(信息科学版),2017,42(11):1518-1522.