Argmax公司发布了名为WhisperKit的软件包,这款软件包允许OpenAI的Whisper语音识别模型在苹果手表上顺畅运行。这一创新性的整合成果,得益于苹果公司的CoreML框架,使得Whisper可以在所有支持该框架的苹果设备上大展拳脚。
通过利用苹果神经引擎的高效性能,WhisperKit能够实时处理语音数据,为WatchOS应用程序带来强大的语音识别功能。值得一提的是,这款软件包在MIT许可下开源发布,对运行环境的要求仅为macOS 14.0或更高版本以及Xcode 15.0或更高版本。
开发者们可以轻松地将WhisperKit集成到自己的Xcode项目中,并根据需要灵活选择音频格式和模型。一位富有创意的用户甚至将WhisperKit与他的Vision Pro头戴式耳机相结合,实现了声音转录功能。
自2020年成立以来,Argmax公司一直在自然语言处理、推荐系统和计算机视觉等领域深耕细作。作为开源项目,WhisperKit鼓励开发者们积极贡献代码,共同推动其功能和适应性的提升。
Argmax公司推出WhisperKit的初衷,是希望扩大苹果生态系统中语音识别技术的覆盖范围,推动其在各类应用程序中的广泛应用。
近年来,在苹果手表等设备上使用大型语言模型已成为趋势,旨在实现本地处理复杂任务的目标。这种方法不仅能减少延迟,提高隐私保护水平,还能为用户带来更加流畅的互动体验。
与此同时,一些独特的设备如Rabbit R1和Humane Ai Pin也在人工智能整合方面取得了显著成果。Rabbit R1通过一个模型直接与用户界面交互,而Humane Ai Pin则采用了基于人工智能的操作系统,实现了无需激活词即可快速访问服务的功能,重点关注用户隐私和便捷性。这些设备将人工智能的使用场景转移到更小巧的设备上,使技术更加个性化和高效。