Meta的Fundamental AI Research(FAIR)团队近期公布了一系列新的AI模型、数据集和工具,标志着在高级机器学习智能研究方面取得了重要进展。此次发布的成果包含八个不同的研究项目,广泛涉及AI的多个领域,有望促进整个领域的创新加速。
其中,Meta Segment Anything Model 2.1(SAM 2.1)是该团队图像和视频分割工具的升级版。新版本在对象跟踪能力和区分外观相似对象方面有所提升。自11周前首次发布以来,SAM 2已被下载超过70万次,应用于医学成像、气象学等多个领域。
此外,Meta还推出了Meta Spirit LM,这是一个开源的语言模型,能够无缝集成语音和文本。其多模态特性使得语音生成更加自然,并为跨模态AI应用提供了新机遇。
针对大型语言模型(LLM)开发者,Meta提供了Layer Skip解决方案。该方案旨在不依赖专业硬件的情况下加速LLM的生成时间,可能使这些强大工具更加易用且成本效益更高。
在网络安全领域,Meta发布了SALSA,为研究人员提供了用于基准测试基于AI的密码系统攻击的新代码。这对于验证后量子密码标准的安全性及应对潜在威胁至关重要。
Meta Lingua是一个轻量级代码库,用于大规模语言模型的训练,旨在简化研究过程。其高效且可定制的设计使研究人员能够快速测试新想法,而无需复杂设置。
在材料科学方面,Meta Open Materials 2024是一个数据集和模型包,可能加速新型无机材料的发现。这一开源产品在该领域与最佳专有模型相媲美。
此次发布还包括Self-Taught Evaluator,这是一种生成合成偏好数据以训练奖励模型的新方法,无需依赖人工标注。该方法使用大型语言模型作为“裁判”来产生推理轨迹和最终判断,通过迭代自我改进方案。在多个基准测试中,该方法的表现优于大型模型和使用人工标注标签的模型,且速度远超默认评估器。
最后,MEXMA是一个覆盖80种语言的跨语言句子编码器,结合令牌级和句子级目标进行训练,以提高性能。
MetaFAIR的这一系列发布为AI研究人员和开发者提供了宝贵资源,体现了Meta对开放科学的承诺以及认为广泛获取前沿AI技术可以推动创新和造福社会的信念。