AWS宣布推出五项生成式AI创新,以便各种规模的组织能够构建新的生成AI应用程序,提高员工生产力并改变业务。
其中AWS负责数据和AI的副总裁Swami Sivasubramanian表示:“在过去一年中,数据的增加、可扩展计算的可用性以及机器学习的进步导致了人们对生成AI的兴趣激增,引发了可能彻底改变整个行业和重新设想工作方式的新想法。”他还指出:“今天的公告是一个重要的里程碑,将生成AI带到了每个企业,从初创公司到大型企业,以及每一个员工,从开发人员到数据分析师。通过强大的创新,AWS为客户提供了更大的安全性、选择性和性能,同时还帮助他们紧密地将数据策略与整个组织保持一致,从而充分发挥生成AI的变革潜力。”
1、Amazon Bedrock现已正式推出,以帮助更多客户构建和扩展生成AI应用程序
Amazon Bedrock是一个完全托管的服务,通过一个单一的应用程序编程接口(API),提供来自领先AI公司的基本模型(FMs)。FMs是在大量数据上进行预训练的非常庞大的机器学习(ML)模型。FMs的灵活性使其适用于广泛的用例,从搜索到内容创建再到药物发现。然而,大多数企业在采用生成AI技术时面临一些问题。首先,他们需要一种简单的方式来查找和访问表现出色且最适合其目的的高性能FMs。其次,客户希望应用集成是无缝的,而不需要管理庞大的基础架构群集或产生大量费用。最后,客户希望能够轻松使用基本FM并使用其数据构建差异化的应用程序。由于客户想要进行定制化的数据非常宝贵,它必须在整个过程中完全保护、安全且私密,客户还希望能够控制数据的共享和使用方式。
通过Amazon Bedrock的综合功能,客户可以轻松尝试各种顶级FMs,并使用其专有数据进行私密定制。此外,Amazon Bedrock还提供了独特的功能,如创建能够执行复杂业务任务的托管代理,从预订旅行和处理保险索赔到创建广告活动和管理库存,而无需编写任何代码。由于Amazon Bedrock是无服务器的,客户不需要管理任何基础架构,并且可以使用他们已经熟悉的AWS服务将生成AI能力安全地集成和部署到其应用程序中。Amazon Bedrock考虑到了安全性和隐私性,使客户能够轻松保护敏感数据。
2、Amazon Titan Embeddings现已正式推出
Amazon Titan FM是由AWS在大型数据集上创建和预训练的一系列模型,使其成为支持各种用例的强大的通用功能。作为开放给客户的第一个模型,Amazon Titan Embeddings是一个大型语言模型(LLM),它将文本转换为称为嵌入的数值表示,从而支持搜索、个性化和检索增强生成(RAG)用例。现在,下一个显而易见的问题是,为什么我要这样做呢?
FMs非常适合各种任务,但它们只能基于训练数据和提示中的上下文信息回答问题,这限制了它们在需要及时知识或专有数据的情况下的有效性。为了使用额外的数据增强FM的响应,许多组织转向RAG,这是一种使FM连接到可以参考以增强其响应的知识源的技术。但是,部署RAG需要大量的数据和深度ML专业知识,这使RAG对于许多组织来说变得难以实现。这时Amazon Titan Embeddings就派上用场了。
Amazon Titan Embeddings使客户更容易通过使用他们的专有数据从RAG开始,以扩展任何FM的能力。Amazon Titan Embeddings支持25种以上的语言和最长为8000个令牌的上下文长度(上下文长度越长,模型越能理解对话或文本并生成正确的响应),因此它非常适合根据客户的用例与单词、短语或整个文件一起使用。
3、Meta的Llama 2将在接下来几周内推出
没有一种模型适用于所有用例,为了发挥生成AI的价值,客户需要访问各种模型以发现基于自己的需求最有效的模型。这就是为什么Amazon Bedrock使得客户能够轻松找到和测试一系列领先的FM,包括来自AI21 Labs、Anthropic、Cohere、Stability AI、Amazon以及接下来几周内即将推出的Meta。
Amazon Bedrock是第一个全面托管的生成AI服务,通过托管API向用户提供了Meta的下一代LLM——Llama 2。Llama 2模型相比原始的Llama模型有很大的改进,包括在40%更多数据上进行训练,并且具有4,000个令牌的更长上下文长度以处理更大的文档。经过优化以在AWS基础架构上提供快速响应,通过Amazon Bedrock可获得的Llama 2模型非常适合对话用例。
4、新的Amazon CodeWhisperer功能即将推出,将允许客户使用其私有代码库来安全地定制CodeWhisperer建议,解锁开发人员生产力的新水平
Amazon CodeWhisperer是一种以数十亿行亚马逊和公开可用代码进行训练的AI驱动的编码助手,可以提高开发人员的生产力。开发人员经常在日常工作中使用CodeWhisperer,但有时他们需要将他们组织的内部私有代码库(例如内部API、库、包和类)整合到应用程序中,其中这些代码库都不包含在CodeWhisperer的训练数据中。然而,内部代码可能很难处理,因为文档可能有限,而且没有公共资源或论坛可以让开发人员寻求帮助。
Amazon CodeWhisperer的新定制能力将通过安全地利用客户的内部代码库和资源,为生成AI驱动的编码提供定制化的建议,从而发挥其全部潜力。开发人员通过改进代码建议的相关性来节省时间。首先,管理员通过源(如GitLab或Amazon Simple Storage Service(Amazon S3))连接到他们的私有代码仓库,并安排一个任务来创建自己的定制化。该功能以企业级的安全性和隐私性为基础,可以完全保护定制化,驱动CodeWhisperer的FM不会使用定制化进行训练,从而保护客户宝贵的知识产权。这个定制化功能将作为新的CodeWhisperer企业级版本的一部分,在接下来的几周内提供给用户进行预览。
5、Amazon QuickSight的新生成BI创作能力可以帮助业务分析师使用自然语言命令轻松创建和定制可视化效果
Amazon QuickSight是一个为云端而构建的统一商业智能(BI)服务,提供交互式仪表板、分页报告和嵌入式分析,还通过QuickSight Q提供自然语言查询功能,确保组织中的每个用户都可以以他们喜欢的格式获取所需的洞察。业务分析师经常花费大量时间使用BI工具探索不同的数据源、添加计算和创建、完善可视化效果,然后将其提供在仪表板中供业务相关方使用。为了创建一个图表,分析师必须先找到正确的数据源,识别数据字段,设置过滤器,并进行必要的定制,以确保可视化效果引人注目。如果可视效果需要新的计算(例如年度销售额),分析师必须确定必要的参考数据,然后创建、验证并将可视效果添加到报告中。通过减少业务分析师手动创建和调整图表和计算所花费的时间,组织将受益。
新的生成BI创作能力将QuickSight Q的自然语言查询从回答结构化问题(例如“加利福尼亚州销售前十的产品是什么?”)拓展到帮助分析师从问题片段(例如“前十的产品”)快速创建可自定义的可视化效果,通过问一些后续问题来澄清查询的意图,完善可视效果,并完成复杂的计算。业务分析师只需描述期望的结果,QuickSight会生成引人注目的可视效果,可以通过单击将其轻松添加到仪表板或报告中。