微软为其Phi-3小型语言模型推出无服务器微调功能

2024年07月26日 由 samoyed 发表 182 0

微软是OpenAI的主要支持者和合作伙伴,但这并不意味着微软愿意让OpenAI在生成式人工智能领域独占鳌头。


为了证明这一点,微软今日宣布了一种新的方法,让开发者们无需管理自己的服务器即可免费(初期)对其Phi-3小型语言模型进行微调。


cfr0z3n_vector_art_line_art_detailed_thick_line_blue_tone_graph_934be08e-7aeb-47ba-8525-fc6530972102


微调是指通过系统提示或调整模型的基础权重(参数)来适应AI模型的过程,以便让模型在特定用例和终端用户方面表现出不同的、更优的方式,甚至添加新的功能。


那么Phi-3是什么呢?


微软在4月份发布了Phi-3,这是一个拥有30亿参数的模型,作为第三方开发者构建新应用程序和软件的低成本企业级选项。


虽然Phi-3比其他大多数主流语言模型要小得多(例如,Meta的Llama 3.1拥有4050亿个参数——参数是指导神经网络处理和响应的“设置”),但根据微软生成式AI副总裁塞巴斯蒂安·布贝克(Sébastien Bubeck)当时向VentureBeat提供的评论,Phi-3的表现与OpenAI的GPT-3.5模型相当。


具体来说,Phi-3旨在在编码、常识推理和一般知识方面提供可负担的性能。


现在,Phi-3已经成为一个包含6个不同模型的家族,这些模型具有不同数量的参数和上下文长度(用户可以在单个输入中提供的token数量,即数据的数值表示),后者范围从4000到128000个,成本从每1000个输入token0.0003美元到0.0005美元不等。


然而,如果按照更典型的“每百万”token定价来计算,它的起始价格是每百万token0.3/0.9美元,这正好是OpenAI新推出的GPT-4o mini模型输入价格的两倍,而输出token的价格则贵约1.5倍。


Phi-3被设计为对企业使用是安全的,具有防护栏以减少偏见和毒性。即使在它首次宣布时,微软的布贝克就推广了其针对特定企业用例进行微调的能力。


“你可以带入你的数据,并对这个通用模型进行微调,从而在狭窄的垂直领域获得惊人的性能,”他告诉我们。


但在那时,还没有无服务器选项来对其进行微调:如果你想要这样做,你必须设置自己的Microsoft Azure服务器或下载模型并在你自己的本地机器上运行,而这可能没有足够的空间。


无服务器微调开启新选项


然而,今天微软宣布其Azure AI开发平台中的“Models-as-a-Service(无服务器端点)”向公众开放。


微软还宣布,“Phi-3-small现已通过无服务器端点提供,因此开发人员可以快速轻松地开始AI开发,而无需管理底层基础设施。”


根据微软的博客文章,Phi-3-vision也可以处理图像输入,“很快也将通过无服务器端点提供”。


但这些模型只是简单地通过微软的Azure AI开发平台“按原样”提供。开发人员可以在这些模型之上构建应用程序,但他们不能创建针对自己用例进行微调的模型版本。


对于希望这样做的开发人员,微软表示他们应该转向Phi-3-mini和Phi-3-medium,这些模型可以通过第三方“数据来构建与用户更相关、更安全且经济的AI体验”。


“鉴于它们较小的计算占用空间、云和边缘兼容性,Phi-3模型非常适合进行微调,以提高在各种场景下的基础模型性能,包括学习新技能或任务(如辅导)或提高响应的一致性和质量(如聊天/问答中的响应语气或风格)”,该公司写道。


具体来说,微软表示,教育软件公司可汗学院(Khan Academy)已经在使用经过微调的Phi-3来评估其由微软Azure OpenAI服务支持的Khanmigo for Teachers的性能。


企业AI开发人员的新价格战和功能战


Phi-3-mini-4k-instruct的无服务器微调定价起价为每1000个token0.004美元(每100万个token4美元),而中型模型的定价尚未公布。


虽然这对于希望留在微软生态系统的开发人员来说无疑是一个好消息,但这也标志着微软自己的盟友OpenAI在争取企业AI开发人员方面的一个显著竞争对手。


而就在几天前,OpenAI宣布,其应用程序编程接口(API)的所谓“第4层和第5层”用户,即每天至少花费250美元或1000美元购买API积分的用户,可以通过9月23日之前每天免费微调GPT-4o mini高达200万个token。


此外,Meta刚刚发布了开源的Llama 3.1系列和Mistral的新Mistral Large 2模型,这两款产品也可以针对不同用途进行微调。显然,为企业开发提供有吸引力的AI选项的竞争正在全面展开——AI提供商正在用大小不同的模型来吸引开发人员。


文章来源:https://venturebeat.com/ai/microsoft-unveils-serverless-fine-tuning-for-its-phi-3-small-language-model/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消