Ola推出ChatGPT克隆产品,名为Krutrim

2023年12月18日 由 camellia 发表 261 0

Ola公司的首席执行官Bhavish Aggarwal最近推出了Krutrim(在梵文中意味着人造的)。这也被宣称为“印度首个全栈AI”解决方案。乍一看,这个平台与ChatGPT有着惊人的相似之处——至少是平台的UI/UX部分——但只是绿色的。


1


Aggarwal宣称,Krutrim AI在各种印度语言方面比GPT-4更出色。他说,它基于2万亿个令牌进行训练,能够理解超过20种印度语言,并能够用包括马拉地语、印地语、孟加拉语、泰米尔语、卡纳达语、泰卢固语、奥里亚语、古吉拉特语和马拉雅拉姆语等大约10种语言生成内容。


“今天,所有被称为LLM的AI模型,大部分都是用英语进行训练的,但语言不仅仅是文本。语言还是文化价值、背景和道德的载体,当前的AI模型根本无法捕捉到我们的文化、知识和抱负,鉴于我们的多元文化和多语种遗产,”Aggarwal说。


Krutrim AI真的存在吗?


自信的Aggarwal说:“这不仅仅是现有API上的一个包装层。这也不只是做了一点细微调整,这是AI行业里的人所说的,就是对一个现有模型添加一点额外的数据集。”一些现有的API包括GPT-4、Llama 2、Gemini等。


“这是从科学层面开始的基础工作,改变数学和模型的算法,使其更适合印度语言,”Aggarwal解释道。


在Krutrim发布会上,Aggarwal甚至对一个美国AI公司进行了挖苦,他说:“我们听说他们谈论如何为人类构建AI,以及如何民主地进行这项工作。”


Ola创造了印度首个从零开始的生成式AI模型,这值得称赞,但这一成就的可能性似乎相当稀罕。即使是在印度市场以外的其他主要参与者,也花费了更多的时间和资源从头开始建立他们的生成式AI模型。


Ola首席声称在Krutrim之后,他们将在下一个季度发布其首个多模态Krutrim Pro。他说,对于Krutrim Pro,“所有的维度和模式都将同时作为输入,算法将能够跨模式进行训练。这与分别进行训练的独立文本模型、独立语音模型和独立视觉模型不同。”


有趣的是,OpenAI在三月份宣布了多模态GPT-4,但实际上,GPT-Vision直到九月份才问世——也就是说,过了六个多月。


考虑到与Corover AI、Sarvam AI和Kissan AI等印度同行相比,Krutrim是如何仅仅用三个月的时间就开发出一个LLM模型的,这一点颇为有趣。值得注意的是,这些同行都是在Llama 2或GPT-4的基础上构建他们的模型的,从理论上讲,与Krutrim相比,他们应该花费更少的时间。


此外,埃隆·马斯克花了四个月的时间构建Grok,而xAI正在应对GPU短缺的问题,Oracle在其最新的财报电话会议中也指出了这一点。令人惊讶的是,Aggarwal在整个活动中并没有透露为训练他们的模型而购买的GPU的数量。相反,他说,他们正在内部构建所有这些能力。


此外,Aggarwal并未透露Krutrim AI受训的数据集。在多种语言上训练模型并非易事,尤其是考虑到成本的不断增加。


特别是具有复杂结构和文字的语言,如印地语、卡纳达语或泰卢固语,需要不同数量的令牌。与此相比,英语的简单性使其需要更少的令牌。令牌化差异的经济影响更为显著。训练和使用AI模型的费用依赖于令牌数量、计算和云成本。


Krutrim已经从Matrix Partners筹集了2400万美元的债务,后者也是Ola Electric的股东。然而,Aggarwal此前澄清说,Krutrim是一个独立于Ola的实体。


不管其他的情况如何,Ola还没有发布研究论文或者详情,就是关于受训的数据集,以及领导这一倡议的团队,他们仍然在困惑是否应该称自己为Ola或Krutrim。


所有这些看起来都像是一场营销噱头,目的是为了获得额外的资金。即使是没有将一个扎实的产品投放市场,演示看起来也不太令人信服。

文章来源:https://analyticsindiamag.com/ola-unveils-chatgpt-clone-calls-it-krutrim/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
写评论取消
回复取消