大型语言模型(LLM)作为推动生成式AI工具热潮的关键技术之一,其下一发展前沿或将转向地域化应用。周一,总部位于巴黎的AI初创公司Mistral发布了一款不同于常规LLM的新模型,意在与美国公司Anthropic和OpenAI等竞争对手一较高下。
这款名为Mistral Saba的定制训练模型,专门针对阿拉伯语国家设计,旨在提升阿拉伯语交互体验。Mistral Saba参数相对较少,仅为24亿,一般而言,参数越少,延迟越低,性能表现更佳;但参数更多往往意味着回答更智能,尽管这种关系并非线性。
Mistral Saba的规模与Mistral的一般用途小型模型Mistral Small 3相当。然而,根据Mistral的内部测试,在处理阿拉伯语内容时,Mistral Saba的表现远超Mistral Small 3。
值得注意的是,由于中东与南亚之间的文化交融,Mistral Saba在处理印度语系语言时同样表现出色,尤其是南印度语系,如泰米尔语和马拉雅拉姆语。
这款新模型的发布,标志着这家法国AI巨头在中东市场的战略布局进一步深化。Mistral预计,该模型将有助于其在该地区客户中赢得更多关注。
作为一款现成的模型,Mistral Saba可用于阿拉伯语对话支持或内容生成,使输出内容更加自然和贴切。此外,公司表示,它还可作为内部用例一些微调模型的基础。
上周,Mistral在AI Action Summit上展示了其对商业领域的重视。尽管该公司已从包括Lightspeed Venture Partners、Andreessen Horowitz和Salesforce Ventures在内的国际投资者处筹集了大量资金,但这些外国投资者大多位于美国。
鉴于地缘政治格局的变化,Mistral可能在中东地区投资者的支持下开展下一轮融资。此举将为其在AI领域的技术竞争中保持优势地位提供更多资金,同时将其定位为美国和中国AI公司的国际替代品。Mistral的最新模型Saba可能为此次潜在融资做出贡献。
Mistral Saba可通过Mistral的API访问,也可在企业内部部署,这对能源、金融或医疗保健等敏感行业的公司而言,可能是一个强有力的卖点。
自发布首个开源Mistral 7B模型以来,该公司一直强调其重视多语言支持,此次Saba的发布正是这一定位的延续。Mistral还表示,未来将进一步关注其他区域语言。