AWS re:Invent全景:亚马逊AI新进展及NVIDIA战略合作

2023年11月29日 由 daydream 发表 403 0

在AWS re:Invent期间,NVIDIA为AWS的云计算业务贡献了GPU,并在AWS市场上为其AI企业软件平台增加了一个检索系统。


微信截图_20231129114001


亚马逊网络服务(AWS)在AWS re:Invent会议期间宣布推出面向企业使用的AI聊天机器人,新一代AI训练芯片,扩展合作伙伴关系等。会议于11月27日至12月1日在拉斯维加斯举行。


AWS首席执行官Adam Selipsky在会议第二天的主题演讲中重点讨论了生成式AI,以及如何通过云服务使组织能够训练强大的模型。


Graviton4和Trainium2芯片发布


AWS宣布了其Graviton芯片的新一代,这是为云工作负载设计的服务器处理器,以及为AI基础模型训练提供计算能力的Trainium。


Graviton4(图A)的计算性能比Graviton3提升了30%,核心数量增加了50%,内存带宽增加了75%,Selipsky表示。基于Graviton4的第一个实例将是R8g EC2实例,用于内存密集型工作负载,通过AWS提供。


Trainium2将用于Amazon EC2 Trn2实例,每个实例将能扩展至10万个Trainium2芯片。AWS在一份新闻稿中表示,这提供了在数周内训练具有3000亿参数的大型语言模型的能力。


图A

微信截图_20231129114014


Anthropic将使用Trainium和Amazon的高性能机器学习芯片Inferentia来训练其AI模型,Selipsky和Anthropic的首席执行官兼联合创始人Dario Amodei宣布。这些芯片或有助于AWS冲进微软在AI芯片市场的领域。


Amazon Bedrock:添加内容监管和其他功能


在re:Invent会议期间,Selipsky就Amazon Bedrock(基础模型构建服务)作出了几项宣布:


  • Amazon Bedrock代理现已正式推出预览版。
  • 通过定制微调和持续预训练构建的自定义模型现已向美国客户开放预览版。
  • Amazon Bedrock的监管功能即将推出;监管功能允许组织通过自然语言向导使Bedrock符合它们自己的AI内容限制。
  • Amazon Bedrock的知识库现在在美国通用提供,它可以将Amazon Bedrock内的基础模型与公司内部数据连接起来,以进行检索增强生成。


Amazon Q:AWS进入聊天机器人竞赛


AWS推出了自己的生成式AI助手Amazon Q,设计用于自然语言互动和内容生成工作。它可以适应现有的身份,角色和企业安全权限中的权限。


Amazon Q可以在整个组织中使用,并可以访问许多其他商业软件。AWS将Amazon Q定位为以业务为中心,专门针对可能会询问有关其销售或任务的具体问题的个人员工。


Amazon Q特别适用于在AWS CodeCatalyst内工作的开发人员和IT专业人士,因为它可以帮助解决错误或网络连接问题。Amazon Q将存在于AWS管理控制台和CodeWhisperer的文档中,在无服务器计算平台AWS Lambda中,或在像Slack这样的工作场所通信应用程序中(图B)。


图B

微信截图_20231129114033


Amazon Q具有一个功能,允许应用程序开发人员使用自然语言指令更新其应用程序。这个功能目前在AWS CodeCatalyst中的预览版中可用,并将很快在受支持的集成开发环境中推出。


如今,很多Amazon Q功能在其他AWS服务和产品中都已推出预览版图。例如,联系中心管理员现在可以在Amazon Connect中访问Amazon Q。


Amazon S3 Express One Zone开门营业


现在通用的Amazon S3 Express One Zone是一种新的S3存储类别,根据Selipsky的说法,它是为频繁访问的数据专门构建的高性能和低延迟的云对象存储。它设计用于需要单位时间毫秒级延迟的工作负载,例如金融或机器学习。如今,客户将数据从S3移动到自定义缓存解决方案; 借助Amazon S3 Express单区,他们可以选择自己的地理可用区,并将经常访问的数据与高性能计算相结合。Selipsky表示,与标准Amazon S3相比,Amazon S3 Express One Zone的访问成本可以降低50%。


Salesforce现已在AWS Marketplace上推出


11月27日,AWS宣布与Amazon的Salesforce合作关系将扩展到在AWS Marketplace上访问Salesforce CRM产品的特定产品。具体而言,Salesforce的Data Cloud、Service Cloud、Sales Cloud、Industry Clouds、Tableau、MuleSoft、Platform和Heroku将向Salesforce和AWS的美国共同客户提供。预计将有更多产品可用,并且预计明年将扩大地理可用性。


新选项包括:

  • Salesforce的Einstein Trust Layer内将可用Amazon Bedrock AI服务。
  • Salesforce Data Cloud将支持包括Amazon Simple Storage Service在内的AWS技术之间的数据共享。


“Salesforce和AWS使开发人员可以轻松安全地访问和利用数据与生成式AI技术,以驱动他们的组织和行业的快速转型,”Selipsky在一份新闻稿中表示。


相反,AWS将更频繁地在内部使用Salesforce产品,例如Salesforce Data Cloud。


AWS从更多Amazon Redshift集成中去除ETL


ETL可以是使用事务性数据进行编码的一个繁琐部分。去年,Amazon宣布了Amazon Aurora MySQL和Amazon Redshift之间的零ETL集成。


AWS介绍了与Amazon Redshift的更多零ETL集成:

  • Aurora PostgreSQL
  • Amazon RDS for MySQL
  • Amazon DynamoDB


以上三种现在全球范围内预览中可用。


AWS想要做的下一件事是让事务性数据中的搜索更加顺畅; 很多人为此使用Amazon OpenSearch Service。作为回应,Amazon宣布现在推出采用OpenSearch Service的DynamoDB零ETL。


此外,为了使数据在Amazon DataZone中更容易被发现,Amazon增加了一项新能力,使用生成式AI向数据集添加业务描述。


推出Amazon One Enterprise身份验证扫描器


Amazon One Enterprise允许安全管理以访问酒店业、教育或技术等行业的实体位置。它是一个完全托管的在线服务,与AWS One掌纹扫描仪配对,用于通过AWS管理控制台进行生物特征身份验证。Amazon One Enterprise目前在美国提供预览版。


NVIDIA和AWS达成云协议


NVIDIA宣布通过AWS提供一组新的GPU,其中包括NVIDIA L4 GPU、NVIDIA L40S GPU和NVIDIA H200 GPU。AWS将成为首个将H200芯片与NV link引入云计算的云提供商。通过这个链接,GPU和CPU可以共享内存以加快处理速度,NVIDIA首席执行官Jensen Huang在Selipsky的主题演讲中解释说。采用NVIDIA L40S GPU的Amazon EC2 G6e实例和采用L4 GPU的Amazon G6实例将于2024年开始推出。


此外,NVIDIA的AI构建平台NVIDIA DGX Cloud即将登陆AWS。它的可用日期尚未宣布。


NVIDIA在AWS上将AWS作为NVIDIA 65 exaflop超级计算机Project Ceiba的主要合作伙伴,其中包括16,384个NVIDIA GH200 Superchips。


NVIDIA NeMo检索器


re:Invent期间宣布的另一项是NVIDIA NeMo Retriever,它允许企业客户使用检索增强生成,为其多模态生成式AI应用程序提供更准确的响应。


具体而言,NVIDIA NeMo检索器是一个语义检索微服务,将自定义LLM连接到应用程序。NVIDIA NeMo检索器的嵌入模型确定了词之间的语义关系。然后,该数据被输入到LLM中,LLM处理并分析文本数据。商业客户可以将该LLM连接到自己的数据源和知识库。


NVIDIA NeMo Retriever 现已通过 NVIDIA AI 企业软件平台提供抢先体验,只要可以通过 AWS Marketplace 访问即可。


与 NVIDIA 合作开发检索增强生成服务的早期合作伙伴包括 Cadence 、 Dropbox 、 SAP 和 ServiceNow。

文章来源:https://www.techrepublic.com/article/aws-re-invent-2023-keynote/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消