随着苹果公司秋季发布会的落幕,其推出的“3D touch”技术被称为是“人机交互”界的技术革命,“3D touch”也成为了各大搜索引擎的热搜词。维视图像作为一家致力于视觉传感器研发及应用的公司,在此也要脑洞大开的谈一下机器认知技术。从第一次工业革命,也就是机器拥有了动力开始,“机器”(这里的机器是广义的机器,包括所有民用或工业设备)就不断向着人类能力的方向发展。由此带来的“人机交互(人和机器的沟通交流)”、“机器认知(机器理解客观世界)”技术,逐渐发展为不同的细分专业。“机器认知”技术的基础是机器“感知器官”,也就是机器的信息来源,主要是各种类型的传感器。
接触类传感器:接触类传感器是最早被研发出来的机器认知“器官”。像压力传感器、电容传感器等所有以“接触式”为信息获取方式的都属于此类。典型应用包括:电梯的超载警告系统;智能手机屏幕;各类运动机构的闭环限位装置等。本次要说的“3D touch”其实也属于这一类,但它是其中的佼佼者。传统的智能手机,内置程序只能从屏幕获取四类信息:轻点、双击、单向滑动、双向滑动。所有的APP都只能依据这些信息来源执行相应步骤。而“3D touch”屏幕增加了压力感应器,所以用户可以向手机多输入一种命令“重压”,这使得用户跟手机之间的“沟通”就多了一种手段。所以,“3D touch”在手机行业可谓是“新技术”,但是在科研领域,这不算是特别了不起的技术。
光电传感器:这是一种非接触式传感器,发射端的光线被遮挡以后,就可以得到一个脉冲信号。典型应用包括:自动水龙头开关、红外感知阻断器等。此类传感器能感知的对象行为非常单一,反馈的信号也只有两种——“有/无”,主要在一些项目中充当信号辅助设备。
视觉传感器:俗称摄像头。狭义的讲,它不属于传感器类别。但是从“机器认知”的角度讲,它却是最好的传感器。摄像头可以获取客观世界中的颜色、纹理、形状、轮廓等各种信息,将其存储在“图像”信号中,然后借助图像处理算法获取有用的信息,并传递给机器。这里的视觉传感器不同于我们手机摄像头、数码相机等民用设备,相机之所以能被称为传感器,主要是因为相机能客观真实的反映被摄对象。以维视图像的MV-EM120M黑白CCD相机为例,相机在拍摄过程中所有影响图像灰度等级的因素均可以在程序中得到控制。比如:曝光时间、增益、图像AD位数等。相机可以感知到极其细微的灰度变化,如下图所示的透明材料中的透明液体检测。
了解了“机器感知”常用传感器特点功能后,我们很容易发现,要想提升机器感知能力,必须要提升传感器的信息获取量,那么视觉传感器必然是未来“机器认知”技术发展的核心部件。“机器认知”包括两部分:机器感知——机器获取信息;机器认识——对获取到的信息进行分析处理。上面针对传感器做了简单分析,下面进一步对机器感知手段做个介绍。
机器感知手段——视觉传感器:我们知道了机器感知客观事件的最佳“器官”为工业相机,那么,什么是工业相机?怎么给机器配置合适的工业相机?这些问题具体可以参考“如何准确认知工业相机”一文,这里重点阐述视觉传感器和机器的结合关系。“机器认知”概念的提出是较前沿的提法,这不同于传统的自动化编程机器,“机器认知”的核心是机器可以“思考”,可以随着客观世界的变化而判断自己的动作。那么,机器对物体的感知越细致,可供判断的依据也就越充分。下图展示了两种不同传感器对同一物体的“认识”,很显然采用专业成像系统的图片能够提供更多的信息。所以随着“机器认知”和“人机交互”的提出,势必对视觉传感器,也就是工业相机提出了新的要求和新的挑战。
机器认识手段——图像处理算法:“机器认知”的第二点也非常重要,感知器官获取到了信息,但是该信息不一定是机器能够直接识别的,那么必然要通过一种手段把该信息转换为机器语言,这种转换手段就是“图像处理算法”。由于不同的项目需求和科研需求,针对工业相机获取的图像的分析算法各不相同。像开源的算法平台openCV在民用行业用的比较多,基于衣服图片来搜索对应衣服款式的“衣+”就是依托此平台开发。而面向教学科研领域的XAVIS组态式图像处理开发平台是面向开发者的收费软件,该软件包含了300多个常用图像处理算子,是业内为数不多的以中文界面开发的组态式系统。
当然了,“机器认知”是一种很前沿的概念,包含的前沿技术非常多,学科跨度也很大。本文由“3D touch”引申而来,希望能给行业内外的读者一点启发,将不同领域、行业的先进技术和经验融会贯通,相信未来科幻电影中的智能机器人不会离我们太远的。