Prompt2Model:一种从自然语言指令生成可部署AI模型的通用方法
2023年08月28日 由 neo 发表
367
0
假设你想要构建一个NLP模型来解决一个给定的问题。你需要定义任务的范围,然后找到或创建能够指定预期系统行为的数据,选择一个合适的模型架构,训练模型,通过评估来评估其性能,然后将其部署到真实世界的使用场景中。研究人员已经使得用一行代码就能原型化这样广泛制作的NLP模型成为可能!
Prompt2Model是一个系统,它保留了使用简单提示来指定系统行为的能力,并同时提供了一个可部署的特定用途模型,保留了它的所有优势。上图展示了我们的Prompt2Model的工作架构。本质上,它是一个自动化的流程,它从用户提示中提取任务所需的所有细节,然后收集和组合与任务相关的信息,并通过以下不同的渠道进行部署。
- 数据集检索:根据提示,第一个任务是发现可以支持用户任务描述的现有手动注释数据。
- 数据集生成:为了支持广泛的任务,存在一个数据集生成器,根据提示解析器解析出的用户特定需求,产生合成的训练数据。提示解析器由一个具有上下文学习能力的LLM组成,使用OpenAI的gpt-3.5-turbo-0613。
- 模型检索:使用提供的提示,选择一个具有适合用户目标知识的预训练语言模型。这个选择的模型作为学生模型,并进一步在生成和检索的数据上进行微调和评估。
- WebApp:最后,存在一个易于使用的图形用户界面,允许下游用户与经过训练的模型进行交互。这个使用Gradio构建的Web应用程序可以轻松地公开部署在服务器上。
总之,Prompt2Model是一种快速构建小而强大的NLP系统的工具。它可以直接用于生成特定于任务的模型,在几个小时内就能超越LLM(如gpt-3.5-turbo)的性能,而无需手动数据标注或架构。考虑到模型的可扩展设计,它可以提供一个平台来探索模型蒸馏、数据集生成、合成评估、数据集检索和模型检索等新技术。
展望未来,我们可以将Prompt2Model视为协同创新的催化剂。通过提出不同的挑战,研究人员旨在促进未来框架各个组件中多样化实现和改进的发展。
文章来源:https://www.marktechpost.com/2023/08/27/researchers-from-cmu-and-tsinghua-university-propose-prompt2model-a-general-purpose-method-that-generates-deployable-ai-models-from-natural-language-instructions/