Cosine的Genie:刷新软件工程AI新标准

2024年08月13日 由 daydream 发表 354 0

Cosine,这家源自英国的AI初创企业,已成功募集到250万美元的种子资金,并自豪地宣布他们打造出了“全球顶尖的AI软件工程师”——Genie。这一壮举绝非空谈!Genie在业界公认的SWE-Bench(用于评估AI模型软件工程技能的基准测试)中大放异彩,以30.08%的卓越成绩刷新了行业记录,远远甩开了先前由Factory Code Droid保持的19.27%的高分纪录。


微信截图_20240813103156


更令人瞩目的是,Genie的表现不仅超越了诸多知名AI模型,如仅获得13.8%的Devin,以及在相同测试中得分12.47%的OpenAI GPT-4,彰显了其无与伦比的实力。


微信截图_20240813103217


Cosine在开发Genie的过程中,独辟蹊径,专注于模拟人类软件工程师的推理能力。他们利用独家数据集对Genie进行深度训练,这些数据详尽记录了真实世界中软件工程师解决问题的过程,确保了Genie能够“学以致用”。


Cosine的首席执行官Alistair Pullen兴奋地表示:“我们在将人类推理过程数字化方面取得了关键突破,使得我们的AI模型能够胜任远超当前软件开发团队能力范围的任务。”


Genie不仅能够独立解决代码错误、构建功能、重构代码,还能与人类开发者无缝协作,共同提升工作效率。通过与GitHub的集成,Genie能直接导入问题、生成详尽的工作说明,优化了整个开发流程。其精准的文档识别与就地编辑能力,更是让开发团队如虎添翼,显著提升了生产力。


此次种子轮融资由SOMA和Uphonest Capital领衔,Lakestar和Focal等投资机构也纷纷跟投。Uphonest Capital的合伙人Ellen Ma对Cosine充满信心:“Cosine成功教会了AI进行推理,为企业带来了真正的AI伙伴。”


自2022年成立以来,Cosine在Y Combinator的支持下迅速成长,并在旧金山与伦敦设立了运营中心。展望未来,Cosine计划进一步拓展Genie的功能,覆盖更多编程语言和框架,同时探索小型化模型以应对简单任务,以及构建更强大的模型来挑战复杂难题。


随着AI在软件工程领域的迅猛发展,Cosine的Genie无疑已成为行业的新标杆。然而,面对持续的投资与技术创新,这一领域的竞争也将日益激烈,更多突破与进展值得期待。

文章来源:https://www.maginative.com/article/cosine-unveils-worlds-best-ai-software-engineer-secures-2-5m-funding/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
写评论取消
回复取消