声智科技最新资讯 | 远场声纹和通话技术助力华为音箱声而不同
2018年10月26日 由 荟荟 发表
102526
0
2018年10月26日,华为Mate 20系列国内发布会在上海举办,华为智能音箱正式解锁上市。这款音箱,搭载了声智科技最新的远场语音智能交互引擎,六麦环形麦克风阵列的软硬件一体化的解决方案,支持远场实时通话与声纹识别功能,注定“声”而不同,释放不凡。
听“声”识人
华为智能音箱采用了声智科技推出的全新的远场声纹识别技术,不再受限距离于声纹识别的束缚,能够根据用户的远场语音识别出不同的使用者。支持识别8位“主人”的远场声纹,通过远场声纹来解锁音箱。不仅贴合用户自然的语音交互习惯,保证用户使用的安全性和私密性,还可以根据用户不同的喜好进行内容设定和服务推荐,实现更自由的“千人千面”的个性化体验。
声纹是一种行为特征,就像人类固有的其他生理特性,比如指纹、虹膜、人脸,是独一无二的。每个人的语音波形参数反映的是相应的生理和行为特征,对语音参数进行特征提取和模型匹配,即可判断出说话人的身份。而且,声纹不易纂改,综合利用声音中蕴含的丰富信息,具备较高的安全特性。
然而,声纹识别的唯一性虽然很好,但实际上人的声音具有易变性,易受身体状况、年龄、情绪,噪声等的影响。特别是噪声,在环境噪音较大和混合说话人的环境下,声纹特征很难提取和建模。为了适应远场语音交互方式,改善噪声环境下的声纹识别率,声智科技的远场声纹识别技术,对I-vertor方法进行优化的同时引入其他的特征,大幅提升了声纹识别的准确率。
语“音”拨号
华为智能音箱有一个非常炫酷的技能,用户可以通过语音指令给家人和朋友拨打电话。这项新功能上线后,用户无需时时刻刻带着智能手机,无论在家中,还是办公室里,一句简单的语音指令,就可以通过音箱和家人朋友自由通话。试想一下,即使在厨房做饭,也可以通过智能音箱与朋友,一边通话,一边煲汤,无需束缚双手,也无需局限于距离。这将改变大家的通讯方式。
作为国内首款支持VOIP通话功能的智能音箱,它要适应更加复杂场景的语音交互,这种场景声源往往距离麦克风较远,且存在较大的噪声干扰,需要很强大的信号拾音能力,此外,声音在网络传输过程中会产生语音丢帧、语音编解码的高频损失,并受到全双工通话的回声、噪声及猝发声的干扰等问题。为了解决这些问题,保证华为智能音箱在远场语音实时通话的场景下仍然有出色的实时语音通话效果,声智科技为华为音箱提供了针对VOIP独家定制的远场双工通话解决方案,运用麦克风阵列、音频编解码、丢包补偿和语音重建、网络抖动缓冲等技术,确保流畅的通话体验。
“声”随心动
无论是华为音箱的声纹识别还是VOIP语音通话功能,都离不开最根本的前端声学解决方案。基于声智科技自主知识产权的6麦环形阵列,华为智能音箱可实现360度全方向拾音,满足用户在真实环境中3-5米无死角远场语音交互的需求。搭载声智科技全链条智能远场语音交互系统SoundAI Voice Kit(SVK),集成声波配网、波束形成、声源测向、噪声抑制、混响消除、回声消除、语音唤醒、端点检测、语音识别、声纹识别、语义理解、语音合成、双工通话、自然语言处理等核心算法,确保5米内的嘈杂环境中的精准语音唤醒与识别,让用户无惧环境,想说就说,声随心动。
未来,语音交互作为用户获取智能内容与服务的入口以及智能设备的中控,需要集成更多元的功能,解锁更丰富的应用场景,只有软硬件一体化融合声学前沿技术和智能语言服务的全链条解决方案才是通向智能语音交互时代的正解。
关于声智科技
声智科技是全球领先的声学语音技术和语言智能服务科技创新公司,专注于声学前沿技术和人工智能交互,秉持“听你所言,知你所想”的技术理念,致力于通过不断引领真实环境下的人机交互体验,实现“声音连接智能未来”的使命,“更自由的人机互联”愿景。
声智科技主要提供融合远场语音交互和远场实时通话技术的SoundAI Voice Kit(SVK)语音交互系统,从端到云的智能语音交互技术和服务方案,以及芯片、模组、开发板到完整产品的智能语音应用方案。目前与百度、阿里、腾讯、ARM、NVIDIA、Xilinx、Cypress、Bosch、Cadence等著名企业深度合作,深耕智能家居、智能汽车、智能安防、智能金融、智能教育、智能医疗和机器人等行业,服务小米、百度、阿里、华为、腾讯、联想、创维、金蝶、浪潮、中国移动、奇虎360、中央人民广播电台等客户,是国内服务用户最多、应用场景最全和覆盖地域最广的远场语音交互技术供应商。