Luma宣布,它将开始利用约3000块Nvidia A100 GPU组成的计算集群来训练新的AI模型,这些模型能够“看见并理解、展示和解释,最终与世界互动”。
这一计划的第一阶段涉及创建能够根据文字描述生成3D物体的模型;Luma在今年早些时候在其Discord服务器上推出了名为Genie的模型。接下来将是开发“下一代”生成式人工智能模型,以解决当前GenAI中的问题。
“我们相信多模态对于智能至关重要。为了超越语言模型,下一个突破将来自于视觉。”Yu在一封电子邮件采访中说。"然而,AI需要变得更聪明,以发挥世界在其中看到的潜力。"
为了实现这一愿景,Luma在B轮融资中筹集了4300万美元,由安德森·霍洛维茨(Andreessen Horowitz)等老牌和新支持者参与。根据熟悉此事的消息人士透露,这轮融资使Luma的估值在2亿至3亿美元之间。
Luma目前的重点——推出创建3D模型的AI模型——是一个竞争愈发激烈的领域。有如3DFY和Scenario这样的物体制作平台,以及Hypothetic、Kaedim、Auctoria和Mirage等初创公司。Stability AI最近也推出了一个独立的3D模型生成工具,新创企业Atlas也是如此。即使是像Autodesk和Nvidia这样的老牌公司也开始将足迹延伸到这个领域,推出了将图像转换为3D模型的Get3D应用,以及从文字描述生成模型的ClipForge。
那么Luma的工具将如何脱颖而出?主要是保真度,Yu说。
“目前的模型都在两维图像上接受训练,被要求生成场景时,它们会破坏空间、身体和动作。”他说。“很难在前几次尝试中生成任何连贯且可用的东西,限制了你能使用输出的地方……我们正在将最先进的生成式逼真技术带入一个直观的应用程序中。
考虑到它处于 Luma 雄心勃勃的新路线图的早期,这是很有希望的。Genie 的改进版本今天推出,但未来更强大的生成式 AI 模型还有很长的路要走。
不过,Luma并没有浪费时间,他们计划在明年底之前将其24人的工作团队扩大一倍,同时整合一个由“数千个”GPU组成的模型运行服务器集群。也许它确实会取得进展;时间会证明一切。
Jain说:“我们一直在发展生成式人工智能研究、工程、设计和产品方面的团队,以便将我们的愿景变为现实,并计划在这一轮融资后大幅加快这方面的步伐。”“有了 Genie,人工智能首次大规模创建 3D 事物成为可能,在短短四周内就增长到 100,000 名用户......但我们希望为我们的用户构建更强大、更智能、更有用的视觉模型。