二、机器视觉定位前沿技术
机器视觉定位包括两类:二维定位和三维定位。在国内,三维定位自有技术还非常少,针对该技术的专利申请在国内几乎处于空白。但是在国外,以微软、谷歌、苹果等公司为例,他们早已在三维信息检测、三维空间重构等领域进行了布局。
1、三维姿态跟踪
微软公司在2010年4月推出了Kinect体感游戏设备,该设备是应用于Xbox 360主机的周边设备。主要功能是获取玩家全身上下的肢体动作,来操作Xbox上的游戏。
该设备左侧为红外光发射器,是一种光编码结构光技术;中间为640*480分辨率的彩色CMOS摄像头;右侧为320*240分辨率的红外CMOS摄像头。其获取玩家三维动作的核心技术为类双目立体视觉技术。依托已经标定好的双摄像头之间的基线距离、焦距及视差数据,然后根据红外摄像头采集到的红外点阵图,进而计算出深度信息。
但是Kinect公布的测量精度为:测量2米范围时,理论精度可以达到1cm(有第三方机构实测表示达不到该精度)。由于该设备是面向娱乐行业,对精度和检测结果一致性的要求较低。当然了,微软的软件算法鲁棒性肯定是很好的,主要是其硬件部分采用了低成本的CMOS感应器。相对于维视图像公司针对工业应用研发的双目立体视觉设备MV-VS220来说,在硬件配置方面维视图像可谓是极尽豪华了。其采用了1280*960分辨率的CCD相机,可同时感应可见光和近红外光,标准配置在测量0.8米范围时,重复测量精度可以达到0.6mm。
2、三维空间定位
看过微软的Kinect设备,我们再看看以库卡机器人为代表的三维空间定位技术。近期库卡机器人发布的“机器人大战乒乓冠军”视频炒的挺热门。暂不谈机器人本身的运动速度和精度,这里主要谈谈给机器人做乒乓球定位的三维空间定位技术。如下图所示:
其实该应用的基础技术不是特别前沿,属于比较常规的双目三维定位技术。由于乒乓球在运动过程中速度极高,可以达到3米/秒,被测对象是高速运动目标,所以可以采用高速相机进行抓拍,然后利用帧差分法获取被测目标进而过滤掉背景图像(因为在相机拍摄视野内,除了乒乓球外的其他目标的运动速度极低,在高速相机拍摄的连续两帧图像之间,只有乒乓球的位置会发生变化)。这样一来,左右相机中的待测对象都只有一个点(将乒乓球简化为一个点)了,立体匹配和三维姿态测量的速度就可以很快了。完全能够跟得上乒乓球的运动。
当然了,由于以上产品设备已经正式投入了商业化运营,制造厂家是不可能把具体技术实现进行公布的,我们仅能从结果去猜想。但是从一些非营利性实验室或高校实验室设备提供商所推出的产品,我们是可以从中获得不少有用信息的。以维视图像推出的CCAS双目视觉系统来说,其官网上就有该系统原理的详细介绍。