Amazon发布新版Alexa,采用生成式AI技术

2023年09月21日 由 neo 发表 456 0

“Alexa,让我们聊聊天”——在其语音激活的Echo设备问世近十年后,电子商务和云计算巨头亚马逊今天宣布,其标志性的语音助手Alexa将被一种新的、定制的大型语言模型(LLM)所取代,这种模型利用了硅谷的生成式AI热潮,赋予Alexa更多的能力和类人的对话品质。


_large


这一消息是由亚马逊设备和服务高级副总裁(SVP)David Limp在公司位于华盛顿特区郊外弗吉尼亚州的豪华“HQ2”总部向VentureBeat的与会者宣布的。

新的Alexa LLM将很快在美国的Alexa设备上提供免费预览,亚马逊声称它“更聪明、更会对话”,而且它的声音更“逼真”和“随意”。

据活动上另一位演讲者、亚马逊人工通用智能SVP兼首席科学家Rohit Prasad说,这一消息标志着“我们最喜欢的助手发生了巨大的变化”。


亚马逊希望凭借更多的“现实世界”能力超越OpenAI的ChatGPT

OpenAI凭借其ChatGPT应用的强大能力震惊了世界,并一夜之间成为家喻户晓的名字,而亚马逊进入对话LLM领域则晚了近一年,该公司声称新的亚马逊LLM值得等待。

亚马逊说,与ChatGPT不同,其知识库在2021年底或2022年初关闭,Alexa LLM提供了“实时信息”,并且“更具交互性”,并包含了比以前版本的Alexa更多的信息。

亚马逊在活动中直接提到了ChatGPT,说它的Alexa应用“超越了浏览器或移动端的ChatGPT”,为用户提供了“现实世界应用”,例如食谱、旅游点子等,并且可以为他们写诗。

Prasad说:“让我们的LLM与众不同的是它不仅仅可以告诉你事情,还能教你做事情。”

为了说明这个想法,Limp还在聚集了媒体和亚马逊员工的人群面前进行了一个现场演示,询问他“最喜欢的足球队表现如何”,而Alexa记住了他指的是范德堡大学,展示了它的个性化属性。如果用户最喜欢的队伍赢了,它会用一个“高兴”的声音回答。

Limp还让Alexa写一条信息,并把它发送到他的手机上,提醒他的朋友们观看即将到来的范德堡足球比赛,Alexa在几秒钟内就完成了这个动作。

亚马逊还展示了一个宣传视频,在其中暗示新的Alexa LLM对于用户来说是“家庭成员”的一部分。


四个核心组件和第三方应用

Prasad说,新的Alexa LLM是围绕四个关键组件构建的:大型语言模型、现实世界的设备和服务、个性化的上下文和负责任的AI。

事实上,另一位演讲者,亚马逊Alexa连接和基础设施副总裁Heather Zorn说,开发者已经可以将一些自己的“定制的、专门设计的”第三方LLM集成到Alexa中。

其中已经有了一个受欢迎的开发者是Character.ai,它让用户创建和互动各种虚构的角色和原型,并提供25种不同的性格类型。

另一个开发者,Splash,通过其应用的Alexa集成,为用户提供了创建和预览歌曲的能力。


令人印象深刻的技术

Prasad说,Alexa的文本转语音引擎现在“更能感知情感和语气,并根据说话者的语气在输出中传达类似的情感变化”。

它还包括了一个为对话而设计的新的自动语音识别系统,它使用了一个巨大的Transformer模型,它是同类中最好的,并且会越来越好。

对于内置屏幕和摄像头的亚马逊Echo Show设备,只要参加了Visual ID计划的亚马逊用户看着他们的设备就可以跟它说话——他们不再需要反复说Alexa。他们可以像看着另一个人一样与助手互动。

Prasad说,这要归功于“设备上视觉处理和声学模型协同工作,所以它知道你是在对Alexa还是房间里的其他人说话。”

文章来源:https://biz.crast.net/amazon-announces-new-generative-ai-version-of-alexa/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
写评论取消
回复取消