官方微信
官方微博
歌尔微首款智能声学传感器:助力离线语音AI时代
来源:MEMS  浏览次数:1575  发布时间:2024-07-26

0c22fd97145fd8aa860ef9b1b04fcdc3.png2e458ac2691415b32ff9a434b826e341.png

智能语音技术是人工智能应用最广泛的技术之一,在众多的人工智能产品中应用,此技术可以减少设备操作的学习成本,让智能设备听懂人类的自然语言从而更便捷地满足用户的需求。


智能声学传感器方案是一种边缘计算的解决方案,可以解决传统云计算模式下存在的高延迟、受限于网络稳定性等问题,将语音处理程序放置在靠近用户和语音数据收集点的位置,通过本地化语音处理,实现离线语音唤醒及控制。由于无需联网,语音处理和反馈的时间较短,因此语音交互时客户感觉不到明显的延迟,用户体验较好。


歌尔微作为MEMS声学传感器行业龙头企业,深耕MEMS声学传感器新技术研究,在智能声学传感器技术方面取得突破,研发出了集成AI语音芯片的智能声学传感器产品。该产品是在传统MEMS声学传感器基础上引入AI语音芯片,将语音信号采集部分和语音信号处理单元集成在一起的新型声学传感器,借助于语音芯片强大的信号处理能力,在器件本体实现语音唤醒、语音识别、事件检测等自主功能。该方案为应用系统提供一种灵活的低功耗集成化语音解决方案。


歌尔微为客户推出的智能声学传感器优点十分突出。其采用优化的专用AI语音处理芯片,达到超低的运行功耗,其支持数字信号输出的智能声学传感器的总体监听功耗小于0.5mW,达到与传统数字式MEMS声学传感器相当。同时,通过叠片式集成封装技术,将AI语音处理芯片封装进了声学传感器的内部,实现了小尺寸的效果,其集成尺寸可以达到与传统MEMS声学传感器相当。MEMS声学传感器收集到的音频信号无需向外部网络传递,直接在器件本体内AI语音处理芯片中进行信号处理,该本地化的处理方式使语音交互的延迟降低到0.5s之内,大大提升了用户体验。


其采用了AI语料训练的技术,语音命令的识别率高。


语音交互是人与人之间最自然的交互方式,其使用的门槛低,几乎不需要额外学习,也不需要设置额外的遥控器,可以解放双手进行远距离、无接触式的控制,这在设备的控制应用上具有天然的优势。尤其在全球疫情的背景之下,非接触式的控制更是一种较为安全选择。在智能设备的语音唤醒或命令的应用中,命令词可根据客户的需求进行训练,识别率可达到95%及以上,误识别指标可达到≤2次/24H。可以广泛适用于灯具、空调、风扇等智能家电设备,TWS、智能手表、VR/AR等穿戴设备,以及其它需要长时间、低功耗待机等待唤醒或命令的设备。


除了实现语音唤醒、语音命令之外,智能声学传感器还可以通过语料的训练实现多种声音事件的探测。比如,可识别婴儿啼哭的声音、玻璃破碎的声音、特定呼救的声音、警笛报警的声音、以及其它具有特征的声音。在此模式下,智能声学传感器可以很简单地让用户的设备具备儿童看护、危险事件警报、声音防盗、治安监控等智能功能。


Baidu
map