Ampere宣布256核CPU,与高通合作开发AI加速器

2024年05月17日 由 daydream 发表 134 0

服务器CPU设计商Ampere Computing宣布,其AmpereOne芯片系列将在明年扩展到256个核心。此外,该公司还将与高通合作开发云AI加速器。


微信截图_20240517110922


首席产品官杰夫·威蒂奇(Jeff Wittich)表示,新型Ampere中央处理器(CPU)将比目前市场上的任何CPU提供高出40%的性能。


总部位于美国加利福尼亚州圣克拉拉的Ampere将与高通技术公司合作,利用高通技术公司的高性能、低功耗的Qualcomm Cloud AI 100推理解决方案和Ampere CPU,共同开发AI推理解决方案。


Ampere CEO蕾妮·詹姆斯(Renee James)表示,人工智能日益增长的电力需求和能源挑战使得Ampere以性能和效率为中心的硅设计方法比以往任何时候都更加受到关注。


“我们六年前就开始走这条路了,因为很明显这是正确的道路,”詹姆斯说。“低功耗曾经与低性能同义。但Ampere已经证明这不是真的。我们开创了计算效率的前沿,并在高效的计算环境中提供了超越传统CPU的性能。”


数据中心能效


微信截图_20240517110954


詹姆斯表示,业界正面临着AI快速发展的日益严重的问题:能源。


“目前的路径是不可持续的。我们认为,未来的数据中心基础设施必须考虑如何升级现有风冷环境以适应升级的计算能力,以及构建符合电网可用电力的环保可持续新数据中心。这正是我们在Ampere所追求的。”詹姆斯说。


威蒂奇回应了詹姆斯的评论。


微信截图_20240517111014


“我们为什么要开发新的CPU?是为了解决数据中心日益严重的电力问题——事实上,数据中心消耗的电力越来越多。这一直是个问题。但今天的问题比几年前更加严重,因为现在我们有AI作为催化剂去消耗更多的电力,”威蒂奇说。“我们创建更高效的解决方案至关重要。我们在通用计算中这样做。我们也在AI中这样做。我们确实迫切需要建立涉及众多生态系统合作伙伴的广泛横向解决方案,以便这些解决方案广泛可用,并解决大问题,而不仅仅是解决电力消耗本身。”


威蒂奇分享了Ampere所谓的“AI计算”的愿景,它将传统的云原生能力融入AI中。


“我们的Ampere CPU可以运行一系列工作负载——从最受欢迎的云原生应用到AI。这包括与传统云原生应用集成的AI,如数据处理、Web服务、媒体传输等。”威蒂奇说。


宏大的路线图


微信截图_20240517111027


詹姆斯和威蒂奇都强调了公司即将推出的新AmpereOne平台,并宣布一款12通道256核心的CPU已经准备好在台积电N3制造工艺节点上进行生产。Ampere设计芯片,并与外部代工厂合作进行制造。2023年5月宣布的上一款芯片拥有192个核心。该芯片于去年投入生产,现已上市。


Ampere正与高通技术公司合作,共同推出一个集成AmpereCPU和高通Cloud AI100 Ultra的解决方案。该解决方案将解决行业最大生成式AI模型的LLM推理问题。


威蒂奇表示,与高通合作,Ampere正在开发一个联合解决方案,以制造真正高效的CPU。高通拥有真正高效的高性能AI加速器。他们的Cloud AI 100 Ultra卡在所有方面都非常擅长AI,特别是在非常大的模型上,如数百亿参数的模型。”


他说,当你拥有这样的模型时,你可能想要一个像加速器这样的专业解决方案。因此,Ampere正在与高通合作优化一个联合解决方案,被称为超级微型服务器,该服务器将开箱即用,并方便客户采用,他说道。


“这是针对AI推理领域的人们的一种创新解决方案,”威蒂奇说。“我们与高通合作进行了一些非常酷的工作。”


Ampere即将推出的256核心AmpereOne CPU将扩展其12通道平台。它将采用与现有192核心AmpereOne CPU相同的空气冷却散热解决方案,并且性能比目前市场上的任何CPU高出40%以上,无需采用特殊的平台设计。该公司的192核心12通道内存平台预计仍将在今年晚些时候推出,较之前的八通道内存有所增加。


Ampere还表示,Meta的Llama 3现在正在Oracle Cloud的Ampere CPU上运行。性能数据显示,在没有GPU的情况下,在128核心的Ampere Altra CPU上运行Llama 3的性能与Nvidia A10 GPU与x86 CPU配对时的性能相同,同时功耗仅为前者的三分之一。


Ampere宣布成立UCIe工作组,作为AI平台联盟的一部分,该联盟始于去年10月。作为其中的一部分,该公司表示,将利用其CPU的灵活性,通过利用开放接口技术,使其能够将其他客户IP集成到未来的CPU中。


竞争是好事


微信截图_20240517111050


高管们提供了关于AmpereOne性能以及原始设备制造商(OEM)和原始设计制造商(ODM)平台的新细节。AmpereOne继续保持着Ampere每瓦性能领先的地位,比AMD的Genoa高出50%,比Bergamo高出15%。对于希望刷新和整合旧基础设施以重新获得空间、预算和电源的数据中心来说,AmpereOne每机架的性能提高了多达34%。


该公司还透露,新的AmpereOne OEM和ODM平台将在未来几个月内发货。


Ampere宣布与NETINT合作推出了一款联合解决方案,该方案使用了公司的Quadra T1U视频处理芯片和Ampere CPU,能够同时转码360个直播频道,并使用OpenAI的Whisper模型为40个流实时添加多语言字幕。


微信截图_20240517111107


除了现有的内存标记、QoS执行和网格拥塞管理等特性外,该公司还公布了一项新的FlexSKU功能,该功能允许客户使用相同的SKU来解决扩展和升级用例。


威蒂奇表示,Ampere一直在与Oracle合作,在AI云中运行大型模型,将成本降低了28%,并且仅消耗竞争对手Nvidia解决方案三分之一的电力。


“Oracle节省了大量电力。这让他们能够通过在CPU上运行来部署更多的AI计算能力,”他说。“这就是我们的AI故事,以及它是如何整合在一起的。”


他表示,通过节省的电力,你可以使用减少15%的服务器、减少33%的机架和减少35%的电力来运行。

文章来源:https://venturebeat.com/ai/ampere-scales-cpu-to-256-cores-and-partners-with-qualcomm-on-cloud-ai/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消