Hume发布EVI 2，新一代语音语言融合模型

2024年09月13日由 daydream 发表 395 0

近日，Hume公司推出了其最新的语音语言基础模型EVI 2，该模型将语音处理与文本处理集成到一个强大且统一的系统中。EVI 2标志着AI驱动对话技术的重要进展，为用户提供了更加自然、响应迅速且高度可定制的交互体验。

微信截图_20240913100435

与前代产品相比，EVI 2在语音质量和响应速度上实现了显著提升。其响应延迟已缩短至平均约500毫秒，相比EVI 1降低了40%，实现了接近实时的对话交互，提升了用户与AI之间的流畅性和自然度。

EVI 2的另一大亮点是其先进的情感智能功能。该模型能够同时处理语音和语言信息，更准确地理解用户的情感背景，并在内容和语调上生成富有同理心的回应。这一特性使得EVI 2能够根据不同应用场景和用户偏好调整其个性和说话风格。

对于开发者而言，EVI 2提供了丰富的声音定制选项，允许他们根据性别、鼻音和音调等参数调整语音特性，无需依赖可能带来风险的语音克隆技术。这种定制功能为特定应用或用户创造了独一无二的语音体验。

此外，EVI 2在成本方面也更具竞争力，价格相比前代产品降低了30%，为希望将高级语音AI集成到其应用中的开发者提供了更具吸引力的选择。

目前，EVI 2正处于测试阶段，Hume公司计划在未来几周内继续优化该模型的可靠性、语言支持和指令遵循能力。同时，公司还透露正在研发更大规模的EVI-2-large版本，预计不久后将正式公布。

随着语音AI技术的不断进步，EVI 2的推出标志着向更加自然、情感智能和个性化的AI交互迈出了重要一步。其潜在应用领域广泛，从客户服务到娱乐产业，有望在未来重塑我们与AI的日常互动方式。

文章来源：https://www.maginative.com/article/hume-uniels-evi-2-its-new-voice-to-voice-foundation-model-2/

标签：

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇 OpenBMB MiniCPM3-4B：性能卓越，功能全面的小型语言模型

下一篇谷歌推出DataGemma模型，旨在减少语言模型中的事实错误

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

AGENTIC AI如何塑造未来

每个人都应该知道的48个AI术语

openwebtext glue shunk031/JGLUE piqa wikitext sciq EleutherAI/lambada_openai facebook/flores

AI热点

行业学习机器学习人工智能公司板人工智能未来机器人视觉识别

AI工具

更多工具 »

火山写作

字节跳动旗下团队推出的免费AI英语写作助手

Stable Diffusion

StabilityAI推出的文本到图像生成AI

GitHub Copilot

GitHub AI编程工具

Adobe Firefly

Adobe最新推出的AI图片生成工具

文心一格

AI艺术和创意辅助平台

本周热门

热门企业

热门职位

Maluuba

20000~40000/月

Unity技术经理

Cisco

25000~30000/月深圳市

高级数据分析工程师

PilotAILabs

30000~60000/年深圳市