摘要:针对传统的图像匹配算法存在误匹配率高,特征提取信息也比较少的问题。本文基于BOW+SVM框架组合设计并实现了物品识别算法。对目标物体利用无监督学习的方法构造目标物体的识别模型,再与环境图像进行识别模型的特征点匹配,最后确定并且框选出目标物品。使用SURF算法将目标物品的特征点提取出来,再结合FLANN算法、特征点二次筛选算法与RANSAC算法对目标物体进行识别与框选。
关键词:SURF;特征匹配;FLANN匹配;RANSAC。
1.引言
随着机器人技术的不断发展,使用机器人为处于失能和半失能状态的老人与病人提供日常看护与照顾成为了可能。在机器人所提供的日常服务中,对用户所需的目标物品进行识别抓取是使用最为频繁的一大功能。因此研究利用机械臂对目标物品进行有效识别与抓取技术具有很好的学术价值和现实意义[1]。
本文设计的算法通过彩色摄像头来识别接收环境信息,通过对环境图像信息的处理,来找寻环境中的目标物体。物体识别基本流程为“环境图像接收-目标物体识别-目标物体轮廓位姿标定”,既通过对摄像头所收集的环境信息与目标物体特征匹配,确定目标物品在环境中所在的区域。使用不同算法相互搭配提升程序识别效率,提高对目标物体的辨认精确度。
2.图像脉冲噪点的产生与去除
由于运行时的环境因素,摄像头在获取图像时会受到光线等电磁辐射信号的干扰,这样计算接受的环境图像就会有一些脉冲噪点。这些噪点会影响环境图像和预存信息的特征点间配准度[5]。那么可以对采集的图像用双边滤波去噪的方法进行降噪处理。双边滤波去噪的方式原理是将某个像素值用一个加权平均值来进行代替,该加权平均值服从高斯分布。其数学关系如下:
双边滤波去噪法在有效去除图像上的噪声时又可以保证环境图像有一个良好的边缘[4]。经过这种方法降噪处理后,环境图像的检测区域有更好的稳健性,更加利于后期算法对特征点的提取。
3.目标物体的特征点获取与匹配
3.1特征点的获取与图像匹配
利用SURF算法的对环境图像以及训练集的训练图像进行特征点的提取,再将环境图像提取的特征点进与目标物品模板特征点进行匹配确定目标物体的位置[6]。SURF算法主要有这几个环节实现:转换积分图像、DOH近似、滤波化简、高斯金字塔、定位特征点最后定位特征方向。SURF算法提取的特征点其表达的特征信息与图像信息的大小、图片是否旋转无关并且对光线、电磁辐射等噪声影响也有较高承受能力。
3.2 特征点筛选与分类
在完成了特征点的提取之后,就可以利用提取的特征点与图像进行比对寻找目标物体,但是在进行比对时,图像中的其他信息由于其数学相似性可能会与特征点产生关联,这样就会出现错误的匹配点。这样就会对算法的识别过程造成干扰,降低识别成功率[9]。为了提高特征点的对比成功率,降低错误匹配点数量,后续要设计相关算法进行特征点的筛选处理。
在匹配图像特征点时最经常使用的是蛮力匹配(BF matcher)法[8],这算法恰如其名就是把获取的环境图片内的全部特征点与模板特征点全部进行匹配,在所有匹配结果中找到最佳的匹配点。这个方法简单暴力,直截了当得筛选掉了很大一部分效果不佳的匹配点,但是这样筛选算法运行耗时较长而且算法得灵活性不佳。为了更好的适应室内环境里的物体识别,本文采用了SURF与FLANN结合的匹配方针来解决问题,算法更加灵活运算速度更快。如表1所示结果可知,该组合在环境变换引起的目标物体角度变换、缩放、局部遮挡、光照等问题相比于蛮力匹配有更好的效果。
4.物品的轮廓拟合与姿态框选
4.1 特征点二次筛选算法
通过算法对环境图像中的目标物体进行识别以后,为了进一步确认目标物体所在位置需要设计算法对目标物体进行框选,用来确认目标物体所在的位置与当前姿态,为抓取环节做好准备。在特征点筛选时无论是粗简的BF匹配还是后面选取的FLANN匹配都是通过设定阈值来判断特征点的。这些算法的判断依据仍然比较单一,仍旧会存在不合格的特征点,为之后对目标物体进行轮廓框选时带来麻烦。为了消除这些多余的特征点本文在FLANN匹配特征点并完成目标物品识别后设计了特征点二次筛选算法。
通过实际生活经验可知,目标物体会身处在环境中的某一固定位置,那么在用匹配模型来进行特征点判定时,匹配的特征点应该会集合于目标物品之上。由于环境因素的影响,图片上其他位置会产生多余的特征点,这些特征点会对后面进行轮廓拟合时产生影响,为了消除这些多余特征点,提高轮廓拟合质量本文设计了特征点二次筛选算法。该算法的函数工作主要思路可以描述为:
将获取的数据按照种类进行划分,设定信息的起始位置数据、目标点位置数据、最远点位置数据;
(1)设立一个数据容器,将所有特征点与起始位置进行比较,获得各特征点相对于起始点的欧氏距离,在容器内将各点按照距离远近排序;
(2)根据特征点一定是聚集与目标物体上,在排序中剔除欧氏距离过大、过小的极端数据确定n个数据点(n约为总特征点数的90%);
(3)输出第n位的数据。
该算法可以通过求出容器中第n大的数据内容,来迅速筛选去除目标物体远距离外的特征点。经过FLANN匹配后的特征点点序列以peaco<KilMat>命名存储容器,然后通过特征点二次筛选算法再次处理,算法会依据容器尺度大小对特征点排序,相对平均距离较远的大于x的点位都会被剔除,对剩余特征点进行二次排除。
根据不同尺度下的剔除错误点数目,直接影响特征点二次筛选算法的质量,对于不同尺度下的筛选,对应剔除相应数量的x点。
已知淘汰掉的错误点的数目随着容器尺度的增加而上升。在对工作环境图像进行特征点匹配中,SURF+FLANN算法匹配的特征点数量一半会低于100个,特征点越多,证明环境图像信息越复杂,匹配时产生错误的概率就会增加。然而实际识别情况中我们不需要这么多的匹配点就有一个比较好得准确度,多余的匹配点反而为匹配任务带来负担。容器尺度越大,需要筛掉的错误点就越多。所以特征点二次筛选算法就是在FLANN匹配后,保留位置集中的特征点,去除离散的错误匹配点,当容器尺度较小时虽然可能会将部分正确的特征点去除但是依旧能保持较高的识别率,为后续的轮廓识别提供良好数据。
4.2目标物品的轮廓框选
一般我们对目标物体在环境图像上进行轮廓框选,通常选取RANSAC算法来执行[5]。该算法利用系统中目标物品的特征模型与接受的环境信息对比,比较两边特征点的匹配性,把对应的特征点间进行一一映射,对“局外点”与“局内点”进行划分,找寻目标物体的边际轮廓,最终依据各个特征点给予的信息划分对目标物体进行框选。
随机抽样一致(RANSAC)算法,是一种通过迭代的方式在一组信息样本中估算出最优数学参数模型的算法。针对数据中出现的正确信息与错误信息,通过随机抽样中正确数据出现的概率来对数学模型按照大数据定理、随机性模型等进行估计,最终生成最优结果[7]。该算法被广泛地用于数学与计算机视觉领域,在平面拟合、点云间矩阵变换、地图拼接等场合发挥重要的作用。
RANSA算法为了给经过特征点二次筛选算法处理后的特征点进行迭代计算,将这些特征点生成为一个具有8个自由度的单应性矩阵之中。将该矩阵命名为H(3*3),一般取的值为1,接下来需要对矩阵中剩下来的8个元素进行求解,需要至少特征点有4组匹配成功。
将系统训练所得的特征模型的匹配点位置记作(x,y),(x’,y’)表示经过筛选后的图像中特征点的坐标,表示尺度大小。RANSAC通过不停迭代的方式持续选取4组不共线的匹配点求解其单应矩阵的各项数值,利用该结果去测试其他匹配点综合求得一个完美模型,代价函数为:
当代价函数计算的数值值小于设定数值时,则称它为算法下的“局内点”,不然就是“局外点”。将当前迭代过的“局内点”划分为集合,将包含匹配点最多的“局内点”称为“最优局内点”,每次迭代后产生的新的局内点与最优局内点比较,根据结果及时更新算法的迭代次数。
为了防止上述算法陷入无限迭代循环之中,我们要给算法的迭代次数设定一个阈值k,若大于当前迭代最高运行次数则终止RANSAC算法。此外,该阈值k可根据算法运行状况进行更新,他的变化遵循方程:
为样本可靠度取值0.955,是样本空间中“局内点”的比例值。筛选完的匹配点在经过RANSAC算法处理后展现出很强的一致性,十分适用于对物体进行轮廓拟合,对目标物体进行框选,确定物体当前位姿。
5.结论
本文算法将摄像头采集的环境图像信息经SURF特征点点检测算法提取环境中图像匹配点,再经过FLANN匹配算法处理过后,错误的匹配点数量明显降低但是仍然极小一部分误配点存在,再经过特征点二次筛选算法处理后,匹配的特征点基本都聚集于目标物品上了。最后经RANSAC算法处理后对目标物体进行轮廓拟合,利用拟合的方框展现目标物体的具体位姿。
本文的算法组合缺点也很明显,问题主要是在SURF特征提取的时间比较长不能很好的应用于实时性处理中,但可以将SURF与LBP特征结合,可以提高效率,改善算法。实验结果表明,本文的组合算法对图像的亮度,旋转,缩放等各个方面都有较强适应性。可以应用在图像识别,三维重建等热门领域,在后续的研究中,提高算法的 效率是关键。
参考文献
[1]李听,刘路. 基于视觉与RFID的机器人自定位抓取算法[J].计算机工程,2012,38(23):158-165
[2]徐晓. 计算机视觉中物体识别综述[J]. 电脑与信息技术,2013(10): 4-7
[3]谢文治. 基于图像的物体识别算法研究[D]. 电子科技大学,2011.
[4]肖凯. 图像Mosaics技术综述[J].电子学报,2004(32):630-641.
[5]王乐. 基于视觉伺服的工业机器人控制技术研究[D]. 南京林业大学,2012
[6]邰晶,翟为刚,谭力宁. 最小二乘法的摄像机标定[J]. 现代计算机,2013 (15):25-28
[7]李国栋.服务机器人智能空间中机器视觉测量技术及其应用研究[D].山东大学,2012.
[8]薛英花.智能空间中基于多模式信息获取的物品定位与物品管理[D].山东大学,2011.
[9]吴宗胜. 室外移动机器人的道路场景识别及路径规划研究[D]. 西安工业大学,2017.
[10]Abdel-Hakim A.E.,Farag A.A.. A SIFT descripto with color invariant character [C]. Computer Vision and Pattern Recognition,2006 IEEE Computer Society Conference on. IEEE, 2006, 2:1978-1983
[11]Szczuko P Influence of image transform and quality degradat on SURF detector efficiency[C]. Signal Processing: Algorit, Architectures, Arrange, and Applicat (SPA),2013:285-297.
[12] Abdel-Hakim A.E.,Farag A.A.. A SIFT descriptor with color invariant characteristics[C]. Computer Vision and Pattern Recognition,2006 IEEE Computer Society Conference on. IEEE,2006,2:1978-1983.