Rockset宣布扩展其平台的向量搜索功能,该初创公司在此之前已经推出了同名的高速数据库。
新功能旨在支持云数据的更快速搜索,以支持人工智能应用。向量搜索已成为支持生成式人工智能和其他类型人工智能应用的数据库的必要因素。它允许将图像和手写等非结构化数据存储为向量嵌入,这些是数学结构,使得可以对该信息进行索引和搜索。
结果,向量搜索可以创建更强大和准确的人工智能模型。通过今年早些时候添加向量搜索功能,Rockset成为可行的生成式人工智能模型的数据库选择。
随着今天的更新,Rockset数据库现在支持“近似最近邻计算”(ANN)搜索,意味着它可以在云中实现“十亿级相似性搜索”。但是,正如该公司解释的,仅仅具备向量搜索还不够。因为最强大的大型语言模型会生成具有数千维度的向量嵌入,精确的最近邻计算(ENN)搜索成为一项极其复杂和计算密集的任务。
通过添加对ANN的支持,Rockset使得在云中为任何人工智能模型创建向量嵌入并进行快速相似性搜索成为可能。新功能与Rockset的LlamaIndex和Langchain集成结合使用,以帮助开发人员更快地迭代并创建更相关的人工智能体验。
根据公司的说法,开发人员现在可以将数十亿个向量以及数百TB的重要数据(如文本、JSON、地理和时间序列数据)存储和索引。他们将能够构建可以通过将向量和存储在Rockset数据库上的元数据插入、更新和删除来实时更新自己的人工智能应用程序。新数据在毫秒级的时间内反映在对数据库的搜索中,这意味着一旦添加即可供人工智能模型使用。
Rockset的联合创始人兼首席执行官Venkat Venkataramani表示,将实时信号和更新与向量搜索结合在一起并非易事。然而,没有它们,人工智能应用将无法发挥其巨大的实用价值。他补充道:“我们花了多年的时间设计Rockset以实现实时更新,并且我们非常高兴现在企业可以在实时流数据上构建可扩展的人工智能应用。"
Rockset的数据库旨在支持各种实时应用,不仅仅是人工智能。例如,它被广泛用于"物联网"设备和传感器,这些设备和传感器必须记录和分析进入的数据,以确保机器高效运行且没有停机。
如果一个传感器收集到的数据表明机器可能会故障,Rockset可以记录并提供即时故障排除反馈,防止故障发生。它在网络安全和电子商务等领域也有应用,实时数据在这些领域非常有价值。
Rockset的高速数据库可以在几秒钟内接收和分析数据。此外,该数据库据称更可靠,这要归功于其创新的计算-计算分离功能,该功能为摄入记录和分析记录提供了两个独立的计算能力池,而不是其他数据库只使用一个计算资源池。
如果用于记录进入或分析数据的模块需要比平时更多的处理资源,它不会影响其他性能。据Rockset称,这对于要求苛刻的人工智能应用程序尤其有用。
该公司的声明并非没有依据,因为它最近完成了4400万美元的融资。同期,投资者表示对其在人工智能应用方面的实用性特别印象深刻。Rockset还披露,其收入和客户基数在过去两年中都增长了一倍以上。
Rockset的一些客户已经利用其先进的向量搜索功能在规模上部署了人工智能应用,如低成本航空公司喷气蓝航空公司。
喷气蓝航空公司的高级数据科学和分析经理在最近的一项案例研究中表示,迭代和人工智能的速度是数据库最重要的因素。"我们看到了实时分析和人工智能在改变喷气蓝航空公司的实时决策增强和自动化方面的巨大威力,因为拼凑3-4个数据库解决方案会使应用程序开发变慢"他说。“通过Rockset,我们找到了一种能够与喷气蓝航空公司的快速创新步伐保持同步的数据库。"
Venkataramani在theCUBE的移动直播工作室上露面,参与了AWS re:Invent 2022全球创业计划的报道,他在那里详细讨论了Rockset的实时分析能力和它可以支持的数百种应用程序。