AlphaCodium:超越DeepMind和OpenAI的代码生成工具

2024年01月29日 由 daydream 发表 356 0

微信截图_20240129104443


一款新的开源AI代码生成工具AlphaCodium,受到了谷歌DeepMind的AlphaCode(以及上个月推出的由Gemini驱动的AlphaCode 2)的启发,但现在已经超过了它,本周在Twitter上引起了轰动。


微信截图_20240129104456


“我们离让AI生成比人类更好的代码更近了一步!”Santiago Valdarrama发帖说。“结果证明AlphaCodium是我们见过的最佳代码生成方法。它击败了DeepMind的AlphaCode和他们的新版AlphaCode2,而且不需要对模型进行微调!”


OpenAI的Andrej Karpathy,曾是特斯拉的AI总监,强调了这个工具改进代码生成的“流程工程”方法——“从一种简单的提示:答案范式转变为‘流程’范式,在这种范式中,答案是通过迭代构建的。”


为了提高LLMs在特定代码问题上的表现,AlphaCode的“流程工程”不仅超越了链式思维提示工程,还引入了GAN架构的元素(这是由Ian Goodfellow在2014年开发的),包括一个生成代码的模型以及一个通过测试、反思和规范匹配提供代码完整性的对抗模型。


微信截图_20240129104507


流程从输入开始,然后包括一系列预处理步骤,其中AlphaCodium对问题进行反思,最终得出第一个代码解决方案。然后,它生成额外的测试来帮助完善解决方案,并得出实际有效的最终方案。


AlphaCodium是由Tel Aviv的初创公司CodiumAI开发的——根据其网站介绍,该公司的使命是“使开发人员能够更快地构建零缺陷的软件”。AlphaCodium在CodeContests数据集上进行了测试,该数据集包含大约10,000个竞技编程问题。其在CodeContests基准测试上的表现显示,其性能将GPT-4的准确性从19%提高到44%。据CodiumAI称,“这个结果不仅仅是数值上的改进;它是LLMs在代码生成能力上的一次飞跃,为该领域设定了新的标准。”


CodiumAI成立于2022年,并在2023年3月筹集了1060万美元,分享了AlphaCodium的GitHub仓库和一篇伴随论文《用AlphaCodium进行代码生成:从提示工程到流程工程》。


联合创始人兼首席执行官Itamar Friedman在接受采访时表示,他对AlphaCodium迄今为止引起的关注感到惊讶,但他补充说他知道这是一个突破,可以帮助整个开发者社区——他强调AlphaCodium不仅仅是一个模型,而是一个系统和算法,它启用了一个代码生成模型和一个“批评者”模型之间的“流程”通信。


“这是我们带来的重大事物——将其视为一个流程是很重要的,这就是为什么我们称之为‘流程工程’。”他说。他解释说,这种流程允许AI不仅生成样板代码,还能生成有效且准确的代码。


OpenAI和谷歌DeepMind是最大的编码竞争对手


Friedman指出,他认为OpenAI(开发了Codex)和谷歌DeepMind(开发了AlphaCode和AlphaCode 2)是CodiumAI在编码竞赛中的最大竞争对手——但其最大的竞争对手是代码完整性技术本身。


“我们深受DeepMind的启发。”他说,并补充说他也曾与OpenAI首席执行官Sam Altman讨论过代码完整性的重要性。


“我与Sam高度一致,认为代码完整性不仅对下一代代码构建非常重要,而且对AI的一致性也很重要。”他说。他解释说,AlphaCodium实际上是提供了代码完整性的‘下一代’——“它不仅理解我的规范,还理解我的文化文件、我的信念和其他指南。”


Google DeepMind在其AlphaGo解决方案中包含了流程工程的方面,但没有在AlphaCode中包含,他说——“我不知道为什么。”也许,他建议,这是因为这个想法并不是主流叙述的一部分,即仅仅需要更好的大型语言模型。


“AI之所以不能生成有效的代码,并不是因为你需要一个更好的LLM”他说。“而是因为你需要一个流程。”

文章来源:https://venturebeat.com/ai/new-open-source-ai-coding-tool-surpasses-its-inspiration-google-deepminds-alphacode/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
写评论取消
回复取消