近日,HyperWrite 公司联合创始人兼 CEO Matt Shumer 在社交网络上宣布推出了 Reflection 70B,这一基于 Meta 开源 Llama 3.1-70B Instruct 的大型语言模型(LLM)。Shumer 表示,Reflection 70B 采用了新的错误自我纠正技术,在第三方基准测试中表现突出。
Shumer 称 Reflection 70B 为“全球顶尖的开源 AI 模型”。然而,随后有第三方评估未能重现其所声称的性能指标,导致 Shumer 被指控在社交网络上存在欺诈行为。
该模型的特点在于其反射调优(Reflection-Tuning)技术,这项技术使得模型能在生成文本前自行检测和纠正错误。这一技术的应用使得 Reflection 70B 在某些基准测试中表现出色,尤其是在 MMLU 和 HumanEval 测试中。
为了验证 Reflection 70B 的性能,公众可以在“游乐场”网站上试用演示版本。然而,由于流量激增,HyperWrite 正在努力获取更多的 GPU 资源来支持这一模型的运行。
Shumer 提到,Reflection 70B 的成功部分归功于 Glaive AI,一家专注于创建特定用例数据集的初创公司。Glaive 的快速 AI 模型训练技术帮助 HyperWrite 加速了 Reflection 70B 的开发过程。
HyperWrite 最初由 Shumer 和 Jason Kuperberg 创立,位于纽约州长岛梅尔维尔镇。该公司曾因开发出 Chrome 扩展程序 HyperWrite 而受到关注,该程序可帮助用户撰写邮件和其他文档。至 2023 年 11 月,HyperWrite 已拥有两百万用户,并因其影响力入选《福布斯》年度“30位30岁以下”榜单。
2023 年 3 月,HyperWrite 完成了由 Madrona Venture Group 领投的新一轮融资,获得 280 万美元投资。此轮融资后,公司增加了新的 AI 功能,如虚拟助手服务等。
Shumer 计划在未来推出更大的模型 Reflection 405B,预期该模型将超越目前市场上的顶尖闭源模型。同时,HyperWrite 将发布一份详尽的报告,介绍 Reflection 模型的训练过程和基准测试结果。