第一次人工智能浪潮,是以PC(计算机)为代表的,因为那时候我们看到计算机可以记忆信息、处理程序,我们就觉得很惊奇。PC的出现让大家看到了机器代替人类思考、工作的希望,大家对人工智能抱有非常大的期待。但是后来发现,技术的积累和计算能力各方面都不具备,所以在1970年左右的时候,有很明显的低潮。
第二次人工智能浪潮开始于19世纪80年代,到2000年左右进入一个低潮,主要以日本研究第五代计算机为代表。第五代计算机的特征就是逻辑推理、语言组织,当时想把计算机做成具有强大能力的推理机,可以像人一样做逻辑思考,希望通过比较复杂的逻辑推理模拟人的思维。
简单而言,那时候主要的想法是,人类的思维应该是有一定的逻辑的,只要计算机把人类的逻辑模拟下来,人工智能的能力就能够得到很大的提升。
但后来我们发现,人类的很多能力并不是靠逻辑思维得到的。真正具备严密的逻辑思维对人是少数,或者说生活中使用严密的逻辑思维的场景是少数。人类的智能,很多时候还是比较模糊,但又很直接的判断。我们解一个数学题,可能有比较严格的逻辑,但是我们做人脸识别的时候,其实没有办法把它表示成一个非常严密的逻辑的过程。所以第二次人工智能浪潮中很多的东西做得不是太理想。2000年左右投资减少,不仅仅是风险投资,还有政府对人工智能的投资也减少了,因为大家觉得可能性不是太大。
第三次的人工智能浪潮,则普遍被认为是2006年加拿大的Hinton教授一篇关于深度学习在图象识别当中的应用的文章带动起来的。目前的第三次人工智能浪潮就是以深度学习为代表的。深度学习是机器学习的一种,一般叫深度神经网络,或者叫多层的神经网络。
机器学习与前面提到的严密的逻辑思维的人工智能的区别在于,机器学习类似于统计,逻辑思维是演绎。统计的方法,可以通过大量的标注好的数据,去找到规律从而形成模型,这个模型就可以帮助我们去做一些任务,比如说像人脸识别,语音识别的任务。
原来机器学习是单层的,深度学习是多层的,能够对数据信息进行加工、总结。简单地说,就是在大量的数据中,人工智能自己去发现数据之间的联系、规律,原来是人类去给计算机设定思维逻辑,而深度学习则是计算机自己对数据信息进行总结、抽象,并发现其中的规律。所以我们如今的图像识别、语音识别,都是如此。
举个例子,对一张人脸,也就是一个图像进行识别,原来可能需要用户坐好,表情端正,然后机器根据不同部位的特点、定位来进行判断是不是这个人。但我们人脑不是这样工作的,同一个人,不论是哭、笑,喜怒哀乐,我们都知道是这个人。深度学习就能够将这些信息数据进行抽象、总结,然后输出结果,比如确认你就是这台电脑的用户。
在其他领域,也是如此。比如你给了一幅画,它通过分析告诉你这幅画有一个太阳,一座山,两个人;你给了一段中文,它可以帮你翻译输出为英文或日文;你给了一段语音,它转换成了文字。但一个特点就是深度学习需要大量数据的输入,没有大量的数据来进行分析,是没有办法得到很好的结果的。
有的领域,技术不是问题,但是人们对人工智能带来的市场需求预期过高了。比如图像识别这块,目前图像识别领域只有一个市场需求在支撑,那就是人脸识别。图像识别的技术已经发展得比较成熟了,但是我们发现人们对人类识别的需求并不是那么大,市场需求不足。
去年下半年开始,受资本寒冬影响,经历过一些投资的泡沫和人工智能的行业探索后,人工智能有一个理性的回归。行业内对于人工智能能够做什么,不能做什么,跟前两次人工智能浪潮相比,期望是降低了的,这也有利于人工智能自身的发展。
我们对人工智能的期待程度其实是需要降低的。人工智能就是代替人完成一些人类不愿意做的,比如服务员、简单的文字处理、简单的法律服务这样基础性、重复性的工作,从而让人类去做更有创造性的事情,它不是万能的。
上页 1 2