Meta推出新版Code Llama:更强大、更准确的代码生成AI

2024年01月30日 由 daydream 发表 232 0

Meta宣布推出其代码生成人工智能模型Code Llama的新版本,该模型具备更强的处理能力、更高的准确性,并支持特定的编程语言,如Python、C++、Java和PHP。


微信截图_20240130103128


Code Llama 70B是Meta开源Llama 2大型语言模型的衍生产品,专门设计用于根据自然语言提示生成代码。代码生成通常被认为是生成式人工智能所有用例中最可行的一种。通过帮助大规模生成代码,生成人工智能可以使软件开发更加高效和易于访问,同时使开发人员能够更加创新。


代码生成的问题是,代码必须非常精确和严格,遵循严格的规则和语法,而且它还必须可预测并且像用户期望的那样运行。但是,软件代码通常可能非常长且复杂,这意味着AI模型必须拥有大量的上下文和逻辑来理解和生成它。为了实现这一点,AI模型必须能够访问大量的计算能力,而这正是Code Llama 70B的亮点所在。


作为有史以来最大的开源代码生成模型之一,Code Llama 70B有望成为这个特定子集的AI中最重要的一项基准测试。它具有很大的潜力,因为许多现有的代码生成AI在自动化软件开发方面一直难以做到可靠和安全。


Meta表示,Code Llama 70B接受了超过5000亿个代码及相关数据的标记的训练,这意味着它比早期模型更为强大和健壮。此外,它还具有更大的上下文窗口(10万个令牌),使其能够生成更复杂的代码。


Meta的首席执行官马克·扎克伯格对Code Llama 70B的发布感到非常兴奋,以至于他决定亲自在Facebook上公开发布。他说:“编写和编辑代码已成为当今AI模型最重要的用途之一。编码能力也被证明对于AI模型在其他领域更严谨、更有逻辑地处理信息非常重要。我为这里的进步感到骄傲,并期待将这些进展纳入Llama 3和未来的模型。”


该公司正在向公众提供Code Llama 70B的几个变体,包括一个被称为CodeLlama-70B-Instruct的版本,该版本经过微调以处理自然语言中的代码请求。同时,CodeLlama-70B-Python是一个优化版本,仅用于生成Python语言的代码。据说它已经增加了额外的1000亿个基于Python代码的标记,以确保它在该语言中更准确、更流畅。


Code Llama 70B模型现已可通过Hugging Face、PyTorch、Jupyter Notebook和TensorFlow等一系列平台下载。


文章来源:https://siliconangle.com/2024/01/29/meta-releases-enormously-powerful-code-llama-70b-model-writing-software/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
写评论取消
回复取消