尤茜
国家知识产权局专利局专利审查协作天津中心 天津 300304
摘 要:本文介绍了视频安防领域的技术发展,将基于数据处理技术的视频安防的核心技术进行了全面分析,对其相关专利的主要研究方向进行了划分,并引用了专利文件对其进行解释说明。
关键词:视频安防;数据处理;专利申请
1、引言
1999年开始,视频监控数据处理方面的专利开始出现,人们开始采用一些简单的方法对监控视频的数据进行分析和处理,来检测目标或者进行行为分析。2005年以后,在接下来的十几年中,人们对安防视频数据处理技术逐渐重视,该期间各大智能数字技术公司对申请了大量专利,使得安防视频数据处理技术方面获得的长足发展,进入21世纪,关于智慧城市安防视频数据的处理技术仍然是人们关注的重点。下面就从所筛选出的文献中对各类识别方法的技术特点作一些介绍[1]。
2、基于数据处理技术的视频安防专利的主要研究方向
2.1 目标检测
目标检测方法按应用环境分为静态背景下的运动目标检测以及动态背景下的运动目标检测。静态背景下的运动目标检测方法主要有以下三种:背景差分法、帧间差分法以及光流法,而动态背景下的运动目标检测由于存在着目标与摄像机之间复杂的相对运动,检测方法要比静态背景下的运动目标检测方法复杂。常用的检测方法有匹配法、光流法以及全局运动估计法等。
对于运动目标检测,其代表性专利如下:CN201110190214.6,CN201410557880.2,CN201210344459.4。其中,以CN201210344459.4为例,其涉及一种运动目标检测方法及装置,其具体根据当前背景提取当前帧图像的前景;判断前景的像素个数是否大于预设像素个数,如果是,判断当前帧图像的运动区域的面积是否大于预设运动区域的面积,如果是,记录满足运动区域的面积大于预设运动区域的面积的图像帧数;判断在Δt内满足运动区域的面积大于预设运动区域的面积的图像帧数是否大于预设图像帧数,如果是,确定当前存在运动目标。
2.2 目标跟踪
用来确定目标在视频序列中连续的位置,定位目标在哪里。包括单场景目标跟踪和多场景目标跟踪、多目视觉。单场景目标跟踪包括单目标跟踪和多目标跟踪,在单个场景中对单个目标进行持续跟踪/在单个场景中对多个目标进行持续跟踪。多场景目标跟踪包括重叠场景和非重叠场景,在多摄像机监控网络下,画面有重叠的情况下为同一个目标进行建模实现全局跟踪/在多摄像机监控网络下画面无重叠的情况下为同一个目标进行建模实现全局跟踪。多目视觉是对多个不同的目标进行跟踪(含单场景和多场景)。
对于运动目标跟踪,其代表性专利如下:CN201210271473.6,CN200910076280.3,US12816308,CN201610753304.4。其中,以CN200910076280.3为例,其涉及视频监控智能分析系统和方法及头肩检测跟踪系统和方法,具体通过人体头肩检测、以及对人体头肩的运动估计和跟踪来识别场景中的人,并基于此来实现智能分析,以避免由于以人全身识别人时的不适用。
2.3 目标分类
目标判断和分类主要涉及两个方面的问题,一是特征的选择与提取问题,二是判断准则的定义问题,即分类器的选择问题。对于智能视频监控系统而言,目标判断和分类主要由以下五部分组成:视频获取、预处理、特征提取、分类器构造、判断分类。
对于运动目标分类,其代表性专利如下:CN201110236999.6,US14726209,CN201810146894.3。其中,以CN201110236999.6为例,其涉及基于目标边缘方向的目标分类方法和系统,具体通过背景提取目标特征,利用边缘检测算子进行边缘检测,对图像噪声更为敏感,通过利用多高斯模型快速算法,并直接使用梯度方向直方图特征对运动目标进行分类。
2.4 行为分析
行为分析是利用图像或者视频分析单个主体的行为,包括静态姿态识别和运动行为识别。静态姿态识别即通过静态图像中目标的姿态来估计目标的行为。运动行为识别包括基于空间信息的识别和基于时序推理的识别。基于空间信息的识别主要依据目标的空间信息提取行为特征,不考虑时序间的关联性;基于时序推理的识别除了空间信息,还要考虑时序间的关联性,通常用于复杂行为识别。
对于运动行为分析,其代表性专利如下:CN200710178409.2,CN201210461759.0,WOUS17015083。其中,以CN201210461759.0为例,涉及一种剧烈运动目标检测方法和装置,具体根据一帧图像的前景图像,对该帧图像进行角点(特征点)检测,获得该帧图像中运动目标的特征点。通过确定该帧图像、以及与该帧图像相邻的前一帧图像中,匹配的角点之间的相对位置关系,确定在该帧图像中,所述运动目标的运动方向和运动幅度,从而可以确定在该帧图像中,该运动目标是否为剧烈运动目标。由于本方案根据前景图像,利用数量较少的点来确定运动目标是否发生了剧烈运动,因此,可以有效减少计算量,且由于选择出的特征点可以更准确地表示运动目标的运动信息。
2.5 群体分析
人群分析技术包括人群密度估计、人群中的运动检测、人群跟踪和人群行为的理解四个部分。且随着计算机视觉、模式识别、软件计算、数学建模、数据挖掘,计算智能等领域的发展,异常行为检测的研究也取得了较大的发展。
人群特征提取是进行人群异常行为识别的重要步骤,特征提取是对人群行为进行识别和分类的重要依据。根据图像和对象分为像素级特征提取、纹理特征提取、基于对象特征提取和基于帧的特征提取方法。
基于像素的特征通常通过边缘检测和背景/前景减法获取,且通常只关注底层的密度估计信息。纹理分析集中图像块的高层次分析。基于对象级的特征提取方法,通过确认场景中的对象个体,从而可以获取更加准确的结果。基于帧图像分析是对视场内的整个场景行为建模。基于像素的特征提取属于底层特征提取方法,其它属于高层特征提取方法。基于像素和纹理的特征方法通常用于人群密度异常的估计,对于人群行为无法完成识别。而基于对象和帧的特征提取方法可以提取出对象及行为特征,因此可以进一步完成行为分类识别,因此可以用于人群行为异常识别。一种方法通常无法完整检测异常,通常需要多种特征融合的方法进行异常检测。
对于群体行为分析,其代表性专利如下:CN201010114830.9,CN201110201983.1, CN201010114826.2,CN200910105247.9,CN201610021806.8。其中,以CN201010114830.9为例,其涉及可适用多角度应用场景的人流量统计的方法及系统,具体通过对图像中的检测区域进行场景标定,从而将检测区域划分为若干个子区域;在子区域内,采用分类器对当前图像进行人头检测,确定当前图像中的各人头;对确定出的各人头进行跟踪,形成人头目标运动轨迹;在人头目标运动轨迹方向进行人流量计数。