LlaMA 2:
LlaMA 2是由Meta AI发布的一系列最先进的开源大型语言模型。您可以将其用于商业用途,它附带了代码、预训练模型和微调模型。所有资源均可在HuggingFace上获取,您甚至可以通过在HuggingChat上试用来体验模型的性能。通过公开提供LlaMA 2,Meta AI使研究人员和开发人员能够构建由先进语言能力驱动的创新应用程序。
Claude 2:
Claude 2是Anthropic最新版本的对话式AI助手。它具有更出色的性能、更长的回复,并且可以通过API以及全新的公共测试版网站 claude.ai 进行访问。Anthropic的开发人员专注于增强其在编码、数学和逻辑推理等方面的能力,与之前的Claude版本相比有所改进。例如,Claude 2最近在法律考试的多项选择部分上取得了76.5%的分数,相较于Claude 1.3的73.0%有显著提升。
您可以通过Poe访问各种类型的Claude模型,并亲自体验其性能。
PaLM 2:
Google AI的PaLM 2是Google最新的大型语言模型,擅长高级推理任务,包括代码、数学、分类、问答、翻译、多语言熟练度和自然语言生成。其通过优化的计算规模方法、增强的数据集混合和架构改进,在所有这些能力方面胜过以往的PaLM等先进大型语言模型。
您可以通过Bard免费使用它。
Vicuna-33b-v1.3:
Vicuna-33b-v1.3是通过对LLaMA进行监督指令微调,并使用从 ShareGPT.com 收集的12.5万个对话进行微调而得到的。它是Open LLM Leaderboard上众多表现最佳的模型之一。您可以在HuggingFace上免费访问该模型,或在 lmsys.org 上体验官方演示。
MPT-30B-Chat:
MPT-30B-Chat是经过微调以生成对话的聊天机器人。它是通过在多个对话数据集(ShareGPT-Vicuna、Camel-AI、GPTeacher、Guanaco、Baize和一些生成的数据集)上进行微调而创建的。MPT-30B-Chat是Open LLM Leaderboard上的顶级模型之一,您可以在Hugging Face的一个mosaicml空间上免费体验。
结论:
虽然GPT-4依然关闭且无法访问,但令人兴奋的开源大型语言模型正在涌现,任何人都可以使用它们作为替代方案。Anthropic的Claude2、Meta的LlaMA2和MPT-30B等模型在会话能力、推理和多语言应用方面取得了显著进展。虽然规模不及GPT-4那么大,但这些免费可用的模型展示了最先进的语言AI仍在快速发展。它们在数学、编码和逻辑等方面的优势使其成为许多应用的理想替代品。
在LlaMA2模型发布后,出现了众多基于各种数据集进行微调的高性能模型。您可以在Open LLM Leaderboard上查看所有这些模型。