近年来,为了让机器更像人,能够认知事物,从而进行判定和深度学习,计算机视觉技术方法与应用发展迅速。计算机视觉研究如何让计算机可以像人类一样去理解图片、视频等多媒体资源内容。例如用摄影机和计算机代替人眼对目标进行识别、跟踪和测量等,并进一步处理成更适合人眼观察或进行仪器检测的图像。近些年在海量的图像数据集、机器学习(深度学习)方法以及性能日益提升的计算机支持下,计算机视觉领域的技术与应用均得到迅速发展。
当下机器视觉技术已经渗入到我们的日常生活中,从手机里的美颜APP面目识别功能、人脸相册分类,到支付宝面部识别身份验证、储物柜人脸识别,以及工业机器人对物体准确抓取、物流机器人障碍避让等等都是运用了计算机视觉技术。
下面来分析一下计算机视觉的应用领域:
人脸识别
“人脸识别”是人工智能“计算机视觉”领域中最热门的应用,今年2月,《麻省理工科技评论》发布“2017全球十大突破性技术”榜单,来自中国的技术“刷脸支付”位列其中,今后靠脸吃饭完全不是问题。这是该榜单创建16年来首个来自中国的技术突破。人脸识别技术目前已经广泛应用于金融、司法、军队、公安、边检、政府、航天、电力、工厂、教育、医疗等行业。据业内人士分析,我国的人脸识别产业的需求旺盛,需求推动导致企业敢于投入资金。目前,该技术已具备大规模商用的条件,未来三到五年将高速增长。而今年,这一技术有望在金融与安防领域迎来大爆发。
视频监控分析
人工智能技术可以对结构化的人、车、物等视频内容信息进行快速检索、查询。这项应用使得让公安系统在繁杂的监控视频中搜寻到罪犯的有了可能。在大量人群流动的交通枢纽,该技术也被广泛用于人群分析、防控预警等。
视频监控领域盈利空间广阔,商业模式多种多样,既可以提供行业整体解决方案,也可以销售集成硬件设备。将技术应用于视频及监控领域在人工智能公司中正在形成一种趋势,这项技术应用将率先在安防、交通甚至零售等行业掀起应用热潮。
工业视觉检测
机器视觉可以快速获取大量信息,并进行自动处理。在自动化生产过程中,人们将机器视觉系统广泛地用于工况监视、成品检验和质量控制等领域。
机器视觉系统的特点是提高生产的柔性和自动化程度。运用在一些危险工作环境或人工视觉难以满足要求的场合;此外,在大批量工业生产过程中,机器视觉检测可以大大提高生产效率和生产的自动化程度。
医疗影像诊断
医疗数据中有超过90%的数据来自医疗影像。医疗影像领域拥有孕育深度学习的海量数据,医疗影像诊断可以辅助医生,提升医生的诊断的效率。
2015年4月,IBM成立了WatsonHealth部门,开始进军医疗行业。2015年8月6日,IBM宣布以10亿美元的价格收购医疗影像公司MergeHealthcare,并将其与新成立的WatsonHealth合并。2016年2月,IBM又斥资26亿美元收购医疗数据公司TruvenHealthAnalytics。今年2月份,在HIMSS17大会上WatsonHealth公布了IBM的第一个认知影像产品WatsonCliNIcalImagingReview,该产品可检查包括图像在内的医疗数据,帮助医疗服务提供商识别需要关注的最危急情况。
文字识别
计算机文字识别,俗称光学字符识别,它是利用光学技术和计算机技术把印在或写在纸上的文字读取出来,并转换成一种计算机能够接受、人又可以理解的格式。这是实现文字高速录入的一项关键技术。
今年三月份,海康威视研究院预研团队基于深度学习技术的OCR(OpticalCharacterRecognition,图像中文字识别)技术,刷新了ICDARRobustReading竞赛数据集的全球最好成绩,并在「互联网图像文字」、「对焦自然场景文字」和「随拍自然场景文字」三项挑战的文字识别(WordRecognition)任务中取得第一。同期参赛的有来自82个国家的2367支队伍参加,其中包括Google、微软、百度、三星、旷视等团队。
如今“计算机视觉”成为了小风口,大量资本涌入,而2017年可能将是人脸识别产业应用产生突破性进展的一年。人脸识别和视频监控两大方向最受资本青睐,同时技术也在寻找其他方向的突破。