Krisp通过机器学习减少通话时的噪音,即将推出Windows版本
2018年12月11日 由 浅浅 发表
898490
0
2Hz的Krisp是一款全新的桌面应用程序,它使用机器学习来减少背景噪音,如人群声音,甚至孩子哭泣的声音,同时保持你的声音完好无损。它现在支持Mac,很快就会提供Windows版本。
2Hz的联合创始人及Krisp的开发者Davit Baghdasaryan展示了原型技术。这所涉及的技术很复杂,但蕴涵的想法很简单:如果你创建一个机器学习系统,它能够理解人类的声音,平均而言,它可以听到一个音频信号,只选择它的一部分,屏蔽大量的背景噪音。
Baghdasaryan,以前是Twilio的一员,最初的想法是创造一些可以在移动网络上运行的东西,这样T-Mobile或任何人都可以推广内置噪音消除。然而,这种平台方法推广太慢,所以他们决定直接面向消费者。
Baghdasaryan后来表示,吸引顾客的速度很慢,这对一家年轻的初创公司来说是个问题。然而,人们喜欢屏蔽噪音的想法,所以我们决定转移所有的注意力,打造一个面向用户的产品。
工作原理很简单:运行应用程序,它会同时修改传出和传入的音频信号,一端是正常的嘈杂信号,一端是清晰的以语音为中心的信号。一切都在设备上发生,延迟非常短(大约15毫秒),因此不涉及云,也没有任何东西被发送到任何服务器,甚至无需本地存储。该团队正在努力使软件适应和动态学习,但还没有实现。
这种方法的另一个好处是它不需要任何特殊的调整,因为它可以在操作系统的声音处理级别工作,所以无论你使用什么应用程序,只需听Krisp修改过的信号,就好像它是从对方的麦克风中清除了噪音一样。
Windows版本应该与Mac版本相差无几,但会有一个特别以游戏为主的版本。Baghdasaryan指出,游戏玩家更有可能拥有运行Krisp的GPU,并且需要更清晰的通信。因此可能会有一些特定于游戏玩家的高级用户功能。
Baghdasaryan还表示,“目前所有的噪声消除解决方案都需要多个麦克风和一个特殊的形式因素,而且嘴部必须靠近其中一个麦克风。但我们没有这样的要求,我们可以使用单麦克风或对来自网络的音频流进行操作。你可以在任何环境(边缘或网络)和任何方向运行软件。”
此外,Krisp可以轻松扩散到基于AI的芯片,意味着进入移动和嵌入式领域并不困难。“我们已成功将DNN移植到NVIDIA GPU,Intel CPU / GNA和ARM。高通公司也在筹备中。”
为了完成这项工作,该公司迄今为止共筹集了200万美元。
免费下载:krisp.ai/download.html