ChatGPT 3.5 Turbo微调指南:优化你的AI模型

2023年10月17日 由 daydream 发表 557 0

OpenAI最近宣布了GPT-3.5 Turbo的微调功能。此外,OpenAI预计将在秋季后期发布GPT-4.0的微调功能。对于开发人员来说,这是个好消息。


但为什么这个公告如此重要呢?简而言之,这是因为对GPT-3.5 Turbo模型进行微调提供了几个重要的好处。实质上,通过将指令嵌入模型本身,微调使开发人员能够更有效地管理他们的项目,并缩短他们的提示(有时可缩短达90%)。


微信截图_20231017105355

通过对GPT-3.5 Turbo模型进行微调,可以在某些任务上超越基础的Chat GPT-3.5能力。让我们深入探讨如何对GPT-3.5 Turbo模型进行微调。


准备微调数据


微调GPT-3.5 Turbo的数据的第一步是以正确的JSONL格式对其进行格式化。您的JSONL文件中的每一行都有一个包含三种不同类型消息的消息键:


  • 您的输入消息(也称为用户消息)
  • 消息的上下文(也称为系统消息)
  • 模型的响应(也称为助手消息)


这是一个同时包含这三种类型消息的示例:


{
"messages": [
{ "role": "system", "content": "You are an experienced JavaScript developer adept at correcting mistakes" },
{ "role": "user", "content": "Find the issues in the following code." },
{ "role": "assistant", "content": "The provided code has several aspects that could be improved upon." }
]
}


然后,一旦准备好您的数据,您就需要保存JSON对象文件。


上传微调文件


一旦您创建并保存了类似上述的数据集,就可以上传文件进行微调。


以下是OpenAI提供的通过Python脚本上传文件的示例:


curl https://api.openai.com/v1/files \
-H "Authorization: Bearer $OPENAI_API_KEY" \
-F "purpose=fine-tune" \
-F "file=@path_to_your_file"


创建微调任务


现在,终于到了执行微调的时候了。同样,OpenAI提供了一个示例,说明了如何执行此操作:


curl https://api.openai.com/v1/fine_tuning/jobs \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $OPENAI_API_KEY" \
-d '{
"training_file": "TRAINING_FILE_ID",
"model": "gpt-3.5-turbo-0613"
}'


如上例所示,您将需要使用openai.file.create来发送请求以上传文件。记得保存文件ID,因为您将在以后的步骤中需要用到它。


使用微调模型


现在,是时候部署和与微调模型进行交互了。您可以在OpenAI平台上进行操作。


以下是OpenAI的示例:


curl https://api.openai.com/v1/fine_tuning/jobs \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $OPENAI_API_KEY" \
-d '{
"training_file": "TRAINING_FILE_ID",
"model": "gpt-3.5-turbo-0613"
}'


这也是将新的微调模型与原始GPT-3.5 Turbo模型进行比较的好机会。


微调的优点


对GPT-3.5 Turbo中的提示进行微调能够提供三个主要的优点,用于提高模型的质量和性能。


改善可控性


这是微调允许开发人员确保其定制模型更好地遵循特定指令的另一种方式。例如,如果您希望模型以不同的语言(如意大利语或西班牙语)进行完成,微调您的模型可以实现这一点。


同样的情况也适用于如果您需要模型缩短输出或以某种方式回应的情况。


更可靠的输出格式


通过微调,模型可以提高其以一致方式格式化响应的能力。这对于任何需要特定格式的应用程序非常重要,比如编码。具体而言,开发人员可以微调模型,以便将用户提示转换为JSON片段,然后将其后续合并到较大的数据模块中。


自定义语气


如果任何企业需要确保其AI模型生成的输出具有特定的语气,微调是确保这一点最有效的方式。许多企业需要确保他们的内容和营销材料与他们的品牌声音匹配或具有特定的语气,以更好地与客户建立联系。


如果任何企业具有可辨识的品牌声音,他们可以在准备微调数据时微调其GPT-3.5 Turbo模型。具体来说,在上述讨论的“用户消息”和“系统消息”消息类型中进行微调。正确进行后,所有信息将以公司的品牌声音为参考创建,同时还可以显著减少编辑社交媒体内容到白皮书等所有内容所需的时间。


未来的增强功能


如上所述,OpenAI预计很快将发布GPT-4.0的微调功能。除此之外,该公司还将推出一些新功能,例如提供对函数调用的支持以及通过用户界面进行微调的能力。后者将使新手用户更容易进行微调。


这些有关微调的发展不仅对开发人员重要,对企业也同样重要。例如,像Sweep或SeekOut这样的许多有前景的科技和开发者领域创业公司,依赖使用AI来完成其服务。这些企业将会在微调他们的GPT数据模型方面发现应用的巨大潜力。


结论


由于可以对GPT-3.5 Turbo进行微调的新功能,企业和开发人员现在可以更有效地监督模型,以确保其在与应用程序更相符的方式下执行。

文章来源:https://www.kdnuggets.com/how-to-finetune-chatgpt-35-turbo
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消