苹果如何利用ML打造智能产品?WWDC主题演讲揭秘
2023年06月06日 由 Neo 发表
688970
0
在Apple Silicon Mac Pro和 Apple Vision Pro 等众多新产品发布热潮中,WWDC 2023的主题演讲上,Apple 的演讲者从未提及“AI”一词,这是一个值得注意的遗漏,因为它的竞争对手如微软和谷歌一直非常关注目前的生成人工智能。尽管如此,AI 仍然是 Apple 演示的一部分,只是换了个名字。
虽然如今“人工智能”是一个非常模糊的术语,周围既有惊人的进步,也有极端的炒作,但苹果公司选择避免这种联系,而是专注于“机器学习”等术语。例如,在 iOS 17 演示期间,软件工程高级副总裁Craig Federighi谈到了自动更正和听写的改进:
自动更正功能由设备上的机器学习驱动,并且多年来,我们一直在推进这些模型的发展。现在键盘输入利用了这种转换器语言模型,这是单词预测的最先进技术,使自动更正功能比以往更准确。而且,借助Apple Silicon的强大功能,iPhone可以在你每次按键时运行这个模型。
值得注意的是,Apple在一次主题演讲中提到了AI术语“转换器”。公司特别谈到了“转换器语言模型”,这意味着其AI模型使用了转换器架构,这个架构已经推动了许多最近的生成式AI创新,例如DALL-E图像生成器和ChatGPT聊天机器人。
Transformer 模型(2017 年首次引入的概念)是一种用于自然语言处理 (NLP) 的神经网络架构,它采用自我注意机制,允许它优先处理序列中的不同单词或元素。它并行处理输入的能力显着提高了效率,并在翻译、摘要和问答等 NLP 任务中取得了突破。
显然,Apple在iOS 17中的新转换器模型允许句子级别的自动更正,当你按下空格键时,可以完成一个单词或整个句子。它还会从你的写作风格中学习,从而指导其建议。
所有这些设备上的AI处理对于Apple来说相当容易,因为Apple Silicon芯片(自2017年起开始采用的A11芯片)中有一个特殊部分被称为神经引擎,旨在加速机器学习应用。Apple还表示,语音输入“采用了一个新的基于转换器的语音识别模型,利用神经引擎使语音输入更加准确”。
在主题演讲中,Apple 还多次提到“机器学习”:在描述新的 iPad 锁屏功能时(“当你选择 Live Photo 时,我们使用高级机器学习模型来合成额外的帧”);iPadOS PDF 功能(“得益于新的机器学习模型,iPadOS 可以识别 PDF 中的字段,因此你可以使用自动填充功能快速填写联系人的姓名、地址和电子邮件等信息。”);AirPods 自适应音频功能(“通过个性化音量,我们使用机器学习来了解你随时间的聆听偏好”);以及名为 Smart Stack 的 Apple Watch 小部件功能(“Smart Stack 使用机器学习在需要时向你显示相关信息”)。
Apple 还推出了一款名为 Journal 的新应用程序,允许在 iPhone 上锁定和加密个人文本和图像日志(有点像交互式日记)。Apple 表示 AI 发挥了作用,但它没有使用“AI”这个词。
“使用设备上的机器学习能力,你的 iPhone 可以创建个性化的时刻建议来激发你的创作,”Apple 说“建议将根据你 iPhone 上的信息智能地策划,比如你的照片、位置、音乐、锻炼等等。你可以控制启用建议时要包含的内容以及将哪些内容保存到你的日记中。”
最后,在新Apple Vision Pro的演示中,该公司透露,用户眼睛在护目镜正面的移动图像来自一个特殊的3D化身,通过扫描你的脸创建——你猜对了,是机器学习技术。
“使用我们最先进的机器学习技术,我们创造了一个新颖的解决方案,”Apple 说“在使用 Vision Pro 上的前置传感器进行快速注册过程后,该系统使用先进的编码器-解码器神经网络来创建您的数字角色。”
编码器-解码器神经网络是一种神经网络,它首先将输入压缩为称为“潜在空间表示”(编码器)的压缩数字形式,然后根据表示(解码器)重建数据。我们正在推测,但编码器部分可能会分析扫描过程中捕获的面部数据并将其压缩为更易于管理的低维潜在表示。然后,解码器部分可能会使用该压缩信息来生成其面部的 3D 模型。
M2 Ultra——人工智能强者?
在 WWDC 主题演讲期间,Apple 推出了迄今为止最强大的 Apple Silicon 芯片M2 Ultra,它具有多达 24 个 CPU 内核、76 个 GPU 内核和一个 32 核神经引擎,据报道每秒可提供 31.6 万亿次运算,Apple 表示代表比 M1 Ultra 快 40% 的性能。
有趣的是,Apple 直接表示这种能力可能会在训练“大型transformer模型”时派上用场,据我们所知,这是 Apple 主题演讲中对 AI 最突出的提及(尽管只是顺便说一句):
M2 Ultra 可支持 192GB 的超大统一内存,比 M1 Ultra 多出 50%,使其能够做到其他芯片无法做到的事情。例如,在单个系统中,它可以训练大量的 ML 工作负载,例如最强大的离散 GPU 甚至因为内存不足而无法处理的大型变压器模型。
这一发展让一些AI专家兴奋不已。在Twitter上,AI 专家Perry E. Metzger写道,“无论是有意还是无意,Apple Silicon统一内存架构意味着高端Mac现在是运行大型 AI 模型和进行 AI 研究的真正令人惊叹的机器。确实没有多少个同价位的其他系统提供192GB GPU可访问RAM。”
在这里,更大的 RAM 意味着更强大的 AI 模型可以容纳在内存中。这些系统是新的Mac Studio(起价1999 美元)和新的 Mac Pro(起价 6999 美元),它们可能会让许多新人接触到 AI 培训 ,并以台式机和塔式机的形式呈现。目前,苹果似乎已经公开投身于生成式 AI 训练硬件领域。
来源:https://arstechnica.com/information-technology/2023/06/at-apples-wwdc-keynote-ai-never-came-up-by-name-but-it-was-there/