美国当地时间周一,Facebook公布了一个研究项目,加大更强大的语音识别软件的开发力度。Facebook的目标是使计算机能与人进行有意义的对话。如果Facebook目标实现,与现有技术相比将是一个重大进步。
目前,人们利用语音只能完成部分基本任务,例如要求亚马逊Echo智能音箱播放音乐。但是,新技术还能理解或正确的回复更复杂的对话,例如讨论披头士最好的专辑或有关有线电视账单的争论。
Facebook人工智能研究主管扬·勒丘恩(Yann LeCun)表示,“如果脱离脚本,它们的表现就不够好了。”
深度学习等人工智能技术的最新发展,能被用来教授计算机识别图片中的猫。勒丘恩解释说,与简单地识别图片中物体相比,对计算机来说解析语言更为复杂。
勒丘恩表示,例如,计算机通常会被下边的两个句子难住:“The trophy doesn’t fit in your suitcase because it is too large”(纪念品放不到你的行李箱中,因为它太大了)和“The trophy doesn’t fit in your suitcase because it is too small” (纪念品放不到你的行李箱中,因为它太小了)。
理解这两个句子要求根据形容词“large”(大)和“small”(小),搞清楚“it”指的是纪念品还是行李箱。人们通常的理解是,尺寸过大的纪念品放不到行李箱中,过小的行李箱放不下纪念品。
要完全理解语言,计算机必须了解实际世界的基本事实,避免被相当简单的句子搞晕。
向计算机提供帮助的一个途径是,作为教学工具向它们提供实际对话和在网络上使用语言的例子。例如,研究人员利用来自Reddit上一个电影论坛的数据,训练计算机模仿人讨论喜欢的电影;在另外一个例子中,研究人员利用来自维基百科的数据,训练计算机回答与具体电影有关的问题。
Facebook希望全球研究人员分享他们在这一领域的研究成果。Facebook认为,合作有助于加快技术的开发,最终催生能准确理解人类语言的计算机。
Facebook人工智能研究团队开发了免费软件工具,帮助外部研究人员进行相关研究。软件采用开放源代码授权方式,意味着其他研究人员能贡献他们的研究成果,改进底层技术。
目前尚不清楚其他科技巨头人工智能研究人员是否会加盟Facebook项目,为推动这一技术的发展做出自己的贡献。但Facebook高管称,微软等其他公司的研究人员表达了对这一项目的兴趣。
Facebook表示,虽然许多开发语音软件的公司之间存在竞争,但合作可以使各方受益。考虑到这类研究衍生的产品是一个规模达数十亿美元的市场,以及Facebook、谷歌、苹果、亚马逊和微软之间激烈的竞争,Facebook的这一想法可能是空中楼阁。