孙明
沈阳建筑大学信息与控制工程学院 辽宁省沈阳市 110168
摘要:在现如今的社会。计算机技术高度发展,计算机与人类的结合度以越来越高,人机交互程度越来越深入,在这其中,人机手势识别是很重要的一项。目前的人机手势识别已经在多个领域内得到了巨大的成就。本文就手势识别技术的发展现状,主要分为国内与国外的现状进行概括总和。
关键词:手势识别、人机交互、研究、发展、现状
随着计算机技术在人类生活的广泛运用,人机交互已经成为人类生活中不可分离的一部分。人机交互旨在达到人类与及其形成良好便捷的沟通,是计算机更好的为人类所服务,满足人类的需求。人机交互包含了手势、眼动、人脸识别等新兴技术,其中手势识别作为最方便的一项被人类广泛的运用。但手势识别存在一些弊端,比如手势的多样性、多义性以及随着时间和空间的变化,手势会发生一定的变化等,所以手势识别领域实际上是一个多学科知识交叉的领域,包含了各个方面的研究内容。且由于各种因素,关于手势识别的研究无法整体的整合到一个知识框架中去,无法形成一个完整的知识体系,使得手势识别无法普遍的应用到研究或系统中去。
一、手势识别研究的发展
最早期的手势识别只是二维层次上的,通过机器,捕捉人体手肘、胳膊等关键关节部位形成的空间与角度关系,形成一个具体的数据库。在常见的识别设备是数据手套,通过有限技术,把数据手套与电脑通过数据线进行连接,把数据手套检测到的信息传输到电脑中,用电脑自动的生成一个关于该用户该姿势的具体的数据库,以为了具体实践的时候进行对比。早期的数据手套是由多个传感器件组成的,他们可以对各种姿势进行细节的捕捉,提高实践时对姿势的对比准确度但其在使用时还是具有很大的不便,且其价格昂贵,无法得到广泛的应用。
后来,手势识别得到重视并取得了一定的进步,原本的数据手套被光学标记法取代。光学标记法主要运用的是红外线技术,即在录入手势姿势的时候,利用红外线技术扫描用户佩戴的光学标记,记录姿势各个部位细节的位置,形成相应的姿势数据定势,传输到电脑的数据库系统中。此方法虽然相对于数据手套而言能够取得更好的效果,但其设备结构复杂,使用起来非常费时费力。
早期的手势识别方法通过外部的设备与电脑进行连接,是外部设备检测到是数据能够准确的传输到电脑中去,保证了过程的准确性与稳定性,但外部方法会限制人体部位进行自然的表达。比如数据手套,在佩戴后,用户只能做一些稍微简单的手势,一些难度稍大的手势存在巨大的困难,局限了手势的表达方式,所以视觉的手势识别方式随之产生。视觉手势识别是运用视觉的效果对手势进行识别。在用户摆好手势时,先用拍摄设备进行拍摄,把相应的手势转化为二维的图像,再利用计算机视觉技术进行处理,对相应的手势进行识别,从而达到录入的效果。该技术相较之前的技术存在了巨大的革新,在各个方面都有巨大的改善。
1.1国外手势识别技术研究的现状
在国外,具体来说,手势识别技术有许多种,都酒气原理都是视觉的手势识别。
在韩国,一些研究者用熵分析法来进行手势识别。其过程为:先用链码的方式对手势的外部轮廓进行检测,然后把手势先转化为一个二维的图形,计算出这个图形的质心,然后测量出该质心到轮廓边界的距离,从而确定一个具体的手势。该系统识别率高,平均识别率超过百分之九十五。
印度的一些研究者在原有的技术上又提出了新的理论方法。他们通过去除背景,并对手势进行方向识别、拇指检测和手指数量检测,来最终确定手势信息,以使手势识别更加准确。
这些方法都能很好的达到手势精准识别的目的,在手势识别过程中,把计算机和数学进行有效的融合,提高计算机的计算精度,更好的录入正确的手势姿势,使手势识别的效率大幅度的提升。
出来再手势识别方面的专家外,许多大型电子企业也加入到手势识别的研究中,为手势识别的研究注入了大量的新鲜血液,取得了许多显著的成功。例如三星等企业,通过自主的研发团队或者与业界有经验的学者进行合作,共同研发关于手势识别的应用。
他们其中成功研发了一些相关的成就,并用于计算机的应用中。三星的一些产品之中就应用了相应的手势识别技术,可以在对应的产品前使用手势对产品进行无接触的操作,使手势识别应用于实际的生活之中。
1.2国内手势识别研究现状
国内对手势识别的研究主要是各大高校相关专业的学者和研究院的研究者组织进行的。各大高校的学生以及教师配合进行研究,对手势识别的方法进行了大量的创新,现已经有多种手势识别的方法并投入具体的应用中,在为人类生活提供便捷的同时又能够促进科技的发展。例如清华大学计算机科学的一些学者就创新了手势识别的方法,提出了一种基于运动分割的帧间图像运动估计方法,指出可以通过运动、形状、颜色和纹理等特性,对手势进行精确的检测,在该方法的实验过程中,对12种手势的识别率超过了百分之九十;除此之外,还有学者提出可以只要连接计算机的摄像头就可以读取手势的姿势,对手势进行准确的识别,完成手势的静态识别。国内研究者对手势识别方法的创新层出不穷,并在实践中进行大量的实践,在实践中得到大量的数据,在根据数据对手势识别系统进行相应的改进,是手势识别的准确率越来越高。
二、手势识别的技术
不管通过什么方式对手势进行识别,其本质都要经过图像获取、手势检测和分割、手势分析、静态手势识别和动态手势识别这五个过程,目前对手势分割、手势分析和手势识别有着官方的具体的分析。
手势分割包括基于单目视觉和基于立体视觉两个方面。基于单目视觉又分为建立手势形状数据库的方法、人为增加限制的方法和基于徒手的表现特征方法三个部分;基于立体视觉可以分给三维结构和立体匹配。
手势分析可以分为指关节式跟踪法、质心手指等多特征结合法和边缘轮廓提取法。
手势识别可以分为隐马尔科夫模型法、神经网络法和末班匹配发三个部分。
2.1手势分割
手势分割是手势识别过程中非常重要的一部分,其效果直接影响到下一步手势分析的效果。目前工人的对手势分割的分析包括基于单目视觉和基于立体视觉两个部分。
单目视觉是对手势进行一个二维的识别,即用一个设备对手势进行识别录入,使得到的是一个二维空间的数据。在单目视觉中主要的方法有基于徒手的表观特征进行识别、热内增加限制的方法以及建立手势形状数据库的方法。但在现实生活中存在许多外界的客观因素,每种方法实施起来都存在一定的局限性,在具体实施时要结合多种方法,在不同的环境下选择一种最准确的方法作为主导进行分割。
2.2手势分析
通过手势分析可以对手部的形状特征和运动轨迹进行预测,为手势识别提供大量的准确的数据。手势分析的主要方法有边缘轮廓提取法、质心手指等多特征结合法以及指关节跟踪法等。根据细小的手部结构来定位手势整体的姿势数据,为手势识别提供了数据库。通过动态轨迹跟踪,可以让手势识别不停留在静态的层次上,使手势识别进行进一步的更新。
2.3手势识别
手势识别是通过相应的设备,对一个手势进行整体的分割,并接着对各个部分进行细致发扫描识别,在把各个部分识别的记过进行组合,最终形成一个完整的数据库。目前来看,手势识别的方法主要有模板匹配法、神经网络法和隐马尔科夫模型法等等。在这些方法中,通过建立模板或建立关系网的方式对手势进行细致的分析,在应用过程中,把模型或关系网和现实的进行对比。分析现实呈现的手势与原有的模型的匹配程度,从而达到对现实的手势的判断过程。
结束语:
手势识别是人机交互应用的最重要的组成部分,除了其使用简单外,其匹配的准确度也非常高,其的发展状况也可以完全代表着人机交互的发张状况。在现实情况下,手势识别会被许多现实因素所限制,比如光纤、识别设备的新旧、手部的损伤或变化等,这些方面的问题目前还没有有效的解决方法。因此,虽然现在手势识别技术的应用方法有许多种,并出现了许多的创新,但具体而言还需要更多的努力,去克服这些现实问题,通过多种方法对复杂问题进行具体的剖析,使手势识别技术更加广泛的被应用。
参考文献:
[1]武霞,张崎,许艳旭.手势识别研究发展现状综述[J].电子科技,2013,26(06):171-174.
[2]袁博,查晨东.手势识别技术发展现状与展望[J].科学技术创新,2018(32):95-96.