Numenta推出基于大脑的NuPIC,将AI处理效率提高100倍

2023年09月12日 由 daydream 发表 343 0

Numenta已经研究了17年的大脑,现在终于拥有了一款希望将人工智能效率提高100倍的产品。


微信截图_20230912105539


这家总部位于加州红木城的公司由计算机先驱杰夫·霍金斯(Jeff Hawkins)和唐娜·杜宾斯基(Donna Dubinsky)创办,他们正在推出基于神经科学的人工智能商业解决方案——Numenta智能计算平台(NuPIC)。


该产品基于有关大脑和智能的理论,该理论是霍金斯在他的2021年著作《千个大脑》中写到的。


有趣的是,Numenta与游戏初创公司Gallium Studios合作,后者由游戏先驱威尔·赖特(The Sims的共同创始人)和劳伦·艾略特(Where in the World is Carmen Sandiego的共同创作者)创立。Gallium Studios正在开发《Proxi》,他们选择Numenta作为他们的人工智能合作伙伴,因为他们在将人工智能纳入游戏并优先考虑用户信任和隐私方面面临的基本挑战。


通过NuPIC,Gallium Studios可以在CPU上高性能运行LLM,并根据需要使用生成模型和非生成模型。通过对模型和数据的完全控制,Gallium Studios预计Numenta的尖端神经科学研究将实现开发出可以持续学习、适应和智能行为的模拟人工智能玩家。


一个新的软件平台


2


NuPIC利用Numenta独特的架构、数据结构和算法,在CPU上高效部署大型语言模型(LLMs)。这一突破性的平台在人工智能领域标志着重要的里程碑,通过提供具有颠覆性性能、大幅降低成本以及关键的隐私、安全和控制功能。重要的是,NuPIC旨在为开发人员和软件工程师提供便利,无需深入了解深度学习,Numenta首席执行官苏巴泰·艾哈迈德(Subutai Ahmad)在接受VentureBeat采访时表示。


大多数LLMs依赖于图形处理单元(GPU),这是多年来使图形芯片制造商Nvidia成为人工智能巨头的原因之一。但由于GPU具有与CPU相比的灵活编程模型,Numenta选择与x86处理器制造商英特尔合作,而不是GPU。这个想法是通过将大部分处理工作转移到CPU上来降低LLMs的成本。


"我们意识到我们正处于人工智能的混乱时期。每个人都想从中受益,但并不是每个人都知道从哪里开始或如何实现他们需要将LLMs投入生产该的性能"艾哈迈德说。“作为唯一基于千个大脑智能理论的平台,NuPIC提供了将CPU提升为运行LLMs的理想平台的性能结果。借助我们优化的推断服务器、模型库和训练模块,你可以根据你独特的业务需求选择合适的模型,对你的数据进行精细调整,并在CPU上以极高的吞吐量和低延迟运行模型,比在Nvidia A100 GPU上快得多 ——这一切都具备最高的安全性和隐私性。"


此外,NuPIC还可以为企业提供安全和隐私保护。NuPIC的功能包括使用仅CPU实现一致的高吞吐量和低延迟推断,从而消除了复杂且昂贵的GPU基础设施的需求。


与需要将内部数据发送到外部软件即服务(SaaS)服务的替代解决方案不同,NuPIC完全在客户的基础设施中运行,可以在本地或通过主要云提供商的专用云上运行。这种方法确保对数据和模型的完全控制,确保一致的行为,降低成本并增强数据合规性。


3


NuPIC的灵活模型库还提供一系列准备就绪的模型,包括BERT和GPTs。客户可以优化准确性或速度,并创建适应其需求的现有模型的定制版本。


而且,NuPIC使客户能够在不需要广泛机器学习专业知识的情况下快速进行基于LLM的解决方案原型设计。借助专门的人工智能专家团队的支持,NuPIC简化了LLM在生产中的无缝部署。NuPIC作为Docker容器交付,客户可以利用标准的MLOps工具和流程对其进行迭代和扩展。


这些独特的功能为企业带来了显著的业务优势,艾哈迈德表示。NuPIC允许客户在易于访问的CPU上利用LLMs的能力,实现了令人瞩目的吞吐量和延迟提升,在英特尔第四代至强可扩展处理器上比以往更快地运行,提供了10到100倍的性能改进。


NuPIC使客户能够选择合适的LLM,通过自定义数据进行精细调整,轻松实现扩展,并处理更大的模型而无需扩大预算。最重要的是,NuPIC使组织能够完全掌控其数据,确保隐私和建立信任。


Numenta目前仅向有限数量的企业客户提供NuPIC的访问权限。该公司拥有约20名员工,并通过内部和外部资金进行私人融资。


漫长的旅程


微信截图_20230912105838


自2005年以来,艾哈迈德一直与霍金斯一起开展技术研究。最初的想法是了解大脑及其如此高效地运作的原理,然后在计算机科学中模仿这些能力。许多人尝试了这个想法,但是像IBM通过基于大脑的研究一样失败了。但是霍金斯提出了一个独特的理论。


起初,霍金斯创办了红木神经科学研究所,并在2004年出版了一本名为《论智能》的书。


在第一部分中,霍金斯指出大脑的一些部分,如记忆,与一种层次结构,特别是时间层次结构有关。他指出,你可以记住以时间顺序发生的事情,这就解释了为什么你可以轻松记住音乐。大脑就像一个预测机器,从过去吸取经验教训,并对未来进行猜测。


将理论转化为实践


微信截图_20230912105848


现在,霍金斯认为你的大脑中可能有10万个脑区,或称之为大脑皮层,作为整体系统中的独立大脑运作。不同的大脑皮层在思考时会进行协作。


"我们一直觉得从神经科学中可以学到更基本的事物,"艾哈迈德说。"我们现在已经完全理解如何在新皮层中实现智能的基本方式。过去20到30年间,神经科学领域发生了爆炸性增长。我们认为现在是时候利用这些理解,将其转化为真正的算法,并在人工智能系统中实现它们了。"


它是一个可以在任何兼容Intel CPU的软件应用程序上运行的软件。这意味着它可以在Intel和AMD的CPU上运行,但目前还不能在基于Arm的CPU上运行。英特尔已经验证了该技术的可行性,艾哈迈德说。


"我们已经在这个领域待了很长时间了,我们一直在深入研究神经科学,真正试图深入了解大脑的工作原理。所以,杰夫出版了一本名为《千个大脑》的书,两年前出版的。它真正概括了我们的研究,以及我们从神经科学中学到的东西。"


比尔·盖茨将该书评为2021年的五本最佳之一。Numenta调查了该理论如何影响实际的人工智能系统。


“事实证明,我们可以运用这些从神经科学中学到的知识,将大型语言模型(LLMs)或GPT模型的效率提高100倍。"艾哈迈德说。


举个例子,你可以向一个人展示一张猫的图片,人类会立即学会它是一只猫。对于一个AI模型来说,你必须向它展示成千上万张猫的图片,然后它才能认出猫。Numenta开始建立一套用于这些快捷方式的算法。


微信截图_20230912105855


"关键是学习如何从工程角度将大脑的知识映射到现有的硬件系统上"艾哈迈德说。"一旦我们找到了如何将其映射到硬件系统上的方法,我们就可以运行它,而不需要构建我们自己的大脑硬件。"


该公司已经证明它在商业上起作用,并且正在创造收入。


他指出,大脑非常高效,只需要大约20瓦的电力,而深度学习系统需要大量的GPU。通过切换到CPU,处理可以更高效,艾哈迈德说。


"我们认为这是一个分水岭时刻"他说。“人们可以在普通服务器和CPU上使用它。他们无需获取特殊的GPU系统。一旦它在CPU上运行,你就会有很多灵活性,而对于GPU来说,很难编程使其灵活。"


他说,你可以同时运行多个模型,而不需要以大批量操作。它也不需要在云服务中运行,因此可以具有更好的隐私安全性和控制性。


Docker容器是一种在没有复杂安装过程的情况下运行软件的简单方法。


"企业可以节省大量资金,性价比无与伦比"他说。


艾哈迈德表示,CPU的关注是有道理的,因为由于人工智能革命的发展,高端GPU几乎售罄,未来一年或一年半都很难买到。而且与GPU相比,它们也相对不太灵活,通常并行进行同类计算。


"这对我们来说是非常重要的,以便我们能够实现这些更具创新性的算法"艾哈迈德说。"大脑不仅仅是进行大量的矩阵乘法。它有选择性地决定你想计算的内容,何时计算以及如何分配计算,因为这都是大脑中的代谢能量。因此,它开发了许多聪明的策略。但要做到这一点,你需要能够以灵活的方式编写这些算法。因此,CPU在这方面比GPU更好。CPU比GPU灵活得多。"


大脑使用的一个技巧是避免计算,而不是进行大量无用的或重复的计算,艾哈迈德说。


微信截图_20230912105903


“这就是我们将这一思想引入到transformers中的理念”他说。


对我来说,这些听起来有点像在计算机图形中使用人工智能。Nvidia称之为DLSS(深度学习超采样),通过假设图像中的一小片绿色可能意味着下一个它绘制的像素也很可能是绿色的,并且假设像素将是绿色的,从而可以省略大量的计算。这是人工智能和图形协同工作的一个例子。


你可以将现有的LLMs部署在Numenta优化的推理服务器上运行在CPU上。然后你可以在其上编写应用程序。此外,Numenta还有一个训练模型,因此你可以将模型进行微调,使其更适用于你的应用程序。由于它以Docker容器的形式交付,可以在客户的基础设施上运行,例如Gallium Studios自己的系统。


Gallium Studios和游戏与人工智能的未来


微信截图_20230912105910


这正是游戏和人工智能的未来,你可以在Gallium Studios的游戏中找到像你一样的角色,这些角色被称为“proxis”。


Gallium Studios首席执行官劳伦·艾略特(Lauren Elliott)在一份声明中表示:“我们的最新游戏《Proxi》是一个广阔的互动世界,由你的个人记忆和关联构成。我们之所以选择Numenta,是因为我们在将人工智能纳入游戏中面临的基本挑战。我们希望为玩家提供最好的体验,但同时确保不危及他们对我们的信任和隐私。我们可以在CPU上以令人难以置信的性能运行LLMs,并根据需要使用生成模型和非生成模型。由于所有内容都在本地部署,我们对模型和数据拥有完全控制。随着时间的推移,Numenta的尖端神经科学驱动研究将使我们能够构建不断学习、适应和真正智能行为的模拟人工智能玩家。"


这些proxis在某种程度上模拟了你自己。为了在CPU上高效运行,你需要能够同时运行大量模型,这在GPU上很难实现。


"我们的产品方式非常适合他们的游戏。我个人认为这对于许多不同的想要融入人工智能的游戏来说也是如此"艾哈迈德说。"根据确切的模型,他们可能会看到两个数量级的性能提升以及巨大的性价比差异。"

文章来源:https://venturebeat.com/ai/numenta-launches-brain-based-nupic-to-make-ai-processing-up-to-100-times-more-efficient/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
写评论取消
回复取消