动车的时速___________________________________________信息记录材料2021年5月第22卷第5期(信息:技术与应用]
基于仿人机器人视觉技术探析
陈浩天
(徐州工程学院信息工程学院江苏徐州221000)
林肯总统
【摘要】随着人工智能的迅猛发展,仿人机器人可以参与到越来越多的工作领域。在此过程中,高精度的机器人视觉技术越来越成为制约机器人工作水平的关键因素。因此,本文以高校主流的软银仿人机器人NAO为背景,分析了NAO 执行高尔夫球任务所涉及的视觉识别的实现技术。
【关键词】图像处理;计算机技术;仿人机器人
怎么查询高速公路是否封闭
【中图分类号】TP242.6【文献标识码】A【文章编号】1009-5624(2021)05-0123-02
1引言
人工智能作为当今最热门的技术,活跃在全球各个领域。在诞生之初,麦卡锡就提出人工智能的关键因
汽车换挡技巧素应该是创造一个可以完全单独解决复杂问题的智能系统。机器人技术的发展在这一理念的指导下日趋成熟。如今,各种类型的机器人不仅可以模仿和还原人类的一些活动,帮助人类完成一些简单易做的枯燥工作,甚至可以在一些特定领域执行一些危险性高的精密工作。可以说,机器人的蓬勃发展代表着我们已经走到了下一次工业革命的大门。
然而,随着任务量的增加和应用领域的迅速扩展,对仿人机器人感知能力的要求也越来越高。与人获取信息的途径类似,视觉技术是机器人获取信息至关重要的感官。对不同领域特定图像识别任务的研究决定了机器人工作质量的上限。在此背景下,本文以软银NAO机器人在中国机器人技能大赛高尔夫比赛中的任务为背景,分析了NAO图像识别的相关技术。
2仿人机器人NAO视觉系统
NAO机器人是法国研制的一种人形机器人。NAO拥有25个自由度,动作灵活。它还配有一个惯性导航仪装置,在移动时十分平稳,并可随时确定自己的位置[1]o因为其出的工业设计水平和极高自由度的二次开发接口,是目前非常主流的高校教学科研类人机器人平台。
NAO机器人通过头部的两个高清摄像头检测环境信息,920万像素,30帧/秒的图像分辨率。在NAO视觉系统运行过程中,两个摄像头各司其职,一般不会同时运行。下方摄像头用于更近距离的视觉识别,上方摄像头用于更长时间的扫描。NAO两摄像头视野夹角为四十度,系统可以根据两个摄像机的
视场和得到的视觉环境计算出目标与NAO的相对坐标。
3仿人机器人相关视觉技术
3.1视觉信息特征分类
用于图像模式识别的特征大致可归纳为:(1)颜或灰度的统计特征;(2)纹理、边缘特征;(3)代数特征;(4)变换系数特征或滤波器系数特征[2]。针对NAO的实际算法设计和使用场景,本文主要讨论前两者。
在二十世纪八十年代,一些学者创造性地发明了用直方图的形式来表示颜模型。其原理是对于颜特征,进行对应特征向量的变换,进而表现为直方图的形式,一直沿用至今。
形状特征也是机器人视觉信息处理过程中不可缺少的特征,在机器人视觉信息处理中有着广泛的应用。在大多数图像目标识别的任务中,因为形状信息对识别结果有着更至关重要的影响,所以和颜特征相比,形状特征层次更高。形状特征可以分为两部分进行研究和讨论。一种是轮廓特征,主流是傅里叶描述子方法。二是地域特征,常见的是不变矩法。
3.2图像分割
在图像处理中,我们往往需要根据特征处理的具体情况对图像进行分割,这使得我们的视觉信息处理更加高效和准确。这里我们主要讨论两种方法:基于像素的和基于边缘的。
当我们面对图片中相邻像素点灰度值差异较小,但整个图片的像素值分布比较离散的情况时,直方图是一个很好的工具,这属于基于像素的图像分割范畴。当我们要分割这类图像时,可以根据像素直方图的极高值和极低值分别选择和分割目标。这种方法也叫按激素聚类法。常用的方法有K-MEANS和C-meanso聚类分析方法有些简单易行,但缺点是聚类数的统计不容易准确,在目标平移和旋转时干扰较大。这属于基于像素的图像分割。
而对于基于边缘的方法,是从灰度图片分析演化而来的,之后为了对只从灰度图片分割做补充,出现了距量保持法分割子块等技术。
3.3视觉信息处理算法
3.3.1OpenCV相关算法
OpenCV(open source computer vision library)诞生于Intel研究中心,是一个开放源码的计算机视觉库[3]。于1999年出现,在高校计算机视觉相关科研领域和工业应用领域被广泛应用。不管是图像、视频还是信号的分析处理任务,其都能很有效的应用。
3.3.2基于Hough变换的轮廓提取
Hough变换在图像的边缘检测领域内是应用非常广泛且高效的算法。这种算法的核心即把目标空间中的坐标变换到参数空间中,对应参照的某一曲线或曲面。因此,拥有一样的参数特征的点,在这一交换过程后,会在对应的参数空间中产生交集。基于此,评估在交点处的累计程度以此来获得所需的特征曲线的检测数据°Hough可以随着参量性质的改变,变换成数种不同的图形,包括基础图形一一直线、椭圆以及进阶图形一一双曲线、抛物线等[4]o 在此过程中,为了优化变换效率,提高变换的精度,我们
123
〔信息:技术与应用〕信息记录材料2021年5月第22卷第5期
可以采取计算概率的方法,采用分层迭代的思想,并将级联的方法加入进去,从而达到这一目的。
3.3.3颜空间之间的转换
一汽奔腾b50空间模型相对于一个物体来说,是指存在于三维空间中的一个子集,这个子集包含了颜领域中所有的颜,与此同时,这个子集还有一个要求,那就是子集本身必须是可见光子集。由于颜模型的用途主要是代指颜域中的一个特定彩,并且可见光子集包括了任何一个颜域,因此通过推断我们
可以判定,所有的可见光不能同时被纳入颜模型之中。此外,虽然相当一部分的显示装置都是基于三原这一原理基础的,连带普通的图形学说都是采用RGB的模型,但是因为从作用联系上来说,三原与彩明度、调等其他颜参数并没有本质上的关联,所以并不采用RGB模型作为颜模型。
在三原当中,绿和蓝是十分接近的,通常情况下只能采取调整亮度的方法进行两者的相互转化。当三个自变量中的两个具有十分高的相似度,这就意味着通过改变自变量的参数的方式获取相对应的应变量数值的操作将会变得较为复杂。除此之外,在三原模型学说提出之初,每个颜之间的设定本就不够严密完善,颜与颜之间的每项数值都不能很明确地用距离来表现。基于以上列举的两个原因,我们将采用HSV模型代替RGB颜模型的方式来进行算法的执行。
HSV是利用调H、饱和度S和亮度V这三个彩的基本属性来确定颜的。它对应一个倒立的六棱锥,六棱锥的顶部V=1,它包含RGB颜模型中R=1,G=1和B=1的三个面,颜最亮[5]。
4目标定位的实现
根据现有的视觉测距技术,我们可以将信息感知的总体分为下述两种,分别是以单目视觉为基础和立体视觉为基础的距离测量方式。常规来说,只有使用立体视觉的系统才可以获得对象环境的三维空间环境。但由于立体视觉技术的系统计算量庞大,难以运用到实际操作中去,相较之下,基于单目视觉的测量技术在结构和成本等方面来讲都优于前者,并且它所对应的摄像机标定的计算方法也更易方便
操作。不仅如此,后者还可以免去立体视觉的一些弊端,举个例子,立体视觉在现实场景运用中,其视觉范围较小,三维立体的匹配也有较大的难度挑战。在一系列对比下,单目视觉的测距技术显得实用性很强。在此情况下,单目视觉应用于现实生活中的智能车辆与可自行移动的机器人的视觉系统中,以此来实现识别与追踪所规定的目标。
在我们谈及视觉信息分析领域时,对于单目视觉无疑有两个最重要的处理方式,第一是帧内的,第二则是帧与帧之间的。在计算机执行具体任务的时候,两种方法通常是混合使用的。
在NAO执行高尔夫任务时,主要基于单目比例缩放的几何相似算法进行定位。即当目标坐标都在一个面上的时候,目标与这个面平行,并且与摄像头系统的光轴相垂直。基于基础光学理论,目标此时与图像信息中的图像具有相似的属性,根据计算得到的倍数,即可得到目标的实际坐标位置。在实际的高尔夫球击打任务中,因为投影在图片上显示出来是圆形,即当NAO在寻球任务阶段中只要发现了高尔夫球,不管球在哪个相对位置上,都可以沿着球圆心向着视线中线作一个垂直面,高尔夫球被侦测到的轮廓可以理解为这个垂直面在现实中与高尔夫球的相切面。以此思路继续,我们可以算出侦测点与球的距离,进而求得NAO需要前进的方向与水平距离,相关信息可以用于后续运动控制的决策。
5视觉技术应用展望
在实际任务执行过程中,发现视觉处理的效果上依然存在三方面的明显不足:一是在光线变化下颜
识别不准确,在应用中体现的即是识别不到红高尔夫球或是被别的红物体如红地标杆干扰;二是静态视觉识别与动态活动控制的矛盾,即当NAO静态识别出高尔夫球的相对位置并且规划出路径之后,有时会因为机器人电机过热,行走姿态出现偏差引起单步步幅过大,停止位置太近导致下一次寻球工作无法进行,球完全无法出现在NAO视野范围内;还有的时候会因为NAO行进过程不够笔直导致停止位置与预期到达位置偏差太大,球无法进入预设好的视野范围,最终无法进入击球环节。三是当坐标计算偏角太大时,机器人的位置计算会出现较大误差。这些误差主要由于双足机器人的先天缺陷导致,即预设的长距离运动误差较大。克服这个问题主流的方法是将动态实时视觉反馈机制与步幅控制结合来进一步优化,绕过对机器人进行长距离的运动规划,实现精度提高。
6结语
综上所述,本文在机器人NAO视觉系统的基础上,基于NAO在执行打高尔夫球任务时的技术特点,从NAO的基础硬件分析,到其涉及的相关计算机视觉技术,最后介绍了目标定位实现的思路与不足。
【参考文献】
[1]孟宪龙,李龙澍,罗罹.RoboCup中NAO机器人球场目标红球识别与快速球策略[J].电脑知识与技术,2013, 9(24):5515-5519.
[2]翟俊海,赵文秀,王熙照.图像特征提取研究[J].河北大学学报(自然科学版),2009,29(1):106-112.
[3]秦小文,温志芳,乔维维.基于OpenCV的图像处理[J].电子测试,2011(7):39-41.
[4]关鑫洁.基于NAO机器人的视觉与行为研究[D].2015.
[5]袁奋杰,周晓,丁军,等.基于FPGA的RGB和HS V空间转换算法实现[J].电子器件,2010,33(4):493-497.
丰田荣放图片作者简介:陈浩天(1994-),男,江苏徐州,硕士,助教,研究方向:人工智能与视觉技术。
124