从古至今,人类对世界的认知和探索从未止步。出于对宇宙的好奇,人们发明了望远镜去观看更远的景色,发明了显微镜去了解生物的结构,发明了电话让声音跨越空间的距离……探索微渺、洞见世界一直是人们孜孜以求的理想。在智能语音与人工智能领域,科大讯飞也不断深耕突破。近期,讯飞推出了全新拾音品牌——谛听,在拾音技术上探索更多可能。
谛听:源于中国古代的智慧象征
神兽谛听传说是地藏菩萨的坐骑,在中国古代神话故事中,它集群兽的形象于一身,聚众物的优点为一体,其耳为犬耳,尤善倾听。谛听可以通过听觉来辨认世间万物,它天耳神通,能够捕捉天上地下的一切声音,再细微的声音也逃不开它灵敏的听觉,凭其聪慧的听力,帮助地藏修行。
另一方面,谛听不受假象的困惑,聪明的分辨并洞察声音背后的真相,并且拥有信息处理和判断的智慧。在名著《西游记》中,谛听可以通过听音来辨别真假美猴王,它还能清晰辨认“五虫”、“五仙”。
古人对于声音奥秘的探寻,从那时起已埋下伏笔。但谛听之名,并不是只存在于古代传说中。谛听最原始的意思,就是好好听,认真听。
致敬中国古代图腾,科大讯飞的拾音品牌——谛听便取此寓意,怀着明辨细微之声的愿景,善听且智慧,能够专注细微,洞察有道。据了解,讯飞谛听结合自主可控的智能语音与人工智能降噪算法,可以精准识别低至30分贝的微小声音,其基于深度学习的噪声抑制功能,在复杂噪音环境下也能清晰识别人声。
讯飞拾音:识微知著的听觉延伸
最近,某科技博主将国际品牌德国森海塞尔、美国舒尔同类产品和讯飞进行了对比测评,基于实验结果,讯飞谛听在降噪、超小音量拾取、拾音区域等功能上表现出众,在超低音量与较大噪音的情况下,拾音效果对比较为明显,其强大产品力表现出不俗光采。
本次测评的谛听产品是一款拾音设备。通过全自动声源定位技术、自适应波束形成、混响抑制激素及基于深度学习的噪声抑制和语音自动增益调节算法可实现室内说话人自动定位、噪声与混响抑制、音量自动调节等功能,解决常规拾音设备语音采集质量差,小音量无法精准拾取等问题。
谛听特点优势一便是敏锐的“听觉”。一只蚊子飞过的声音大约为40分贝,一般人说话的音量大小在50分贝左右。在评测实验中,低至30分贝的轻声絮语,人耳都无法听见的超小的音量环境下,森海塞尔拾音稳定,内容清晰,舒尔拾取的声音小且难以分辨说话内容,讯飞的谛听拾取的内容清晰,且音量听感较好。
其二,便是与神兽谛听一样,即便面对复杂的声音环境,仍能排除嘈杂,做到拾音精细。在复杂的环境下,各种噪声混合在一起,不仅对拾音更对噪音处理带来挑战。在评测视频中,模拟环境噪音为70分贝和90分贝的情况下,谛听都有效抑制了噪音,能够清晰拾取对话内容,并根据人耳听觉特点对音量和音效自动调整与优化,使声音听起来更加饱满。
除此之外,谛听还具有其他无出其右的亮点。例如说话人跟踪功能,讯飞谛听通过全自动声源定位技术可实时定位人员说话位置,无需预设和限制拾音区域轻松实现360度无死角的拾音;7×24小时全天候稳定拾音,基于人工智能算法,能有效对高声喊叫等异常声音进行预警,满足多种场景需求。
科大讯飞:中国创新之力,洞悉万象之音
作为人们感知外界环境的一个重要通道,听觉在视线障碍、不利光照条件等情况中可起到视觉无法替代的作用,是视觉的重要补充,高质量的音频都将发挥着不可忽视的作用。例如,工业界的检测师通过声音辨别机器是否运转正常,民警通过汽车声音辨别是否违法鸣笛,商铺利用全量的音视频采集来防止偷盗,法院、检察院庭审过程中同步录音录像,保证办案过程公正可追溯。
但拾音器这类专业设备的市场一直被海外品牌所占据,其安全性又决定着了不能完全依赖国外产品及技术。作为亚太地区知名的智能语音和人工智能上市企业,科大讯飞长期从事语音及语言、自然语言理解、机器学习推理及自主学习等核心技术研究并保持了国际前沿技术水平,同时承建了首个语音及语言信息处理国家工程实验室等科技项目,其民族创新与科技创新的原生力量不言而喻。
基于多年的技术积累,科大讯飞在前端拾音技术上发力深耕,其超小音量识别和噪声抑制出色表现,凭卓越产品力突出国际重围,更凭卓越品牌力让世界重新审视。我们期待,正如谛听品牌专注细微,洞察有道的美好愿景,带领好奇的民族去探索微渺的听觉世界,在未知领域探索更多创新与可能。