Bhaiyabot的LLM优于OpenHathi、Lama 2和Mistral 7B

登录注册

资讯

学习

基础知识理论实践学习教程

企业招聘

下载

模型数据集

AI工具箱

企业服务

EVA 智能HR 视频AI

ChatGPT 人工智能应用人工智能未来计算机视觉

热门新闻

行业人工智能

为什么数据污染对LLM来说是一个大问题

机器人康奈尔大学

康奈尔大学推出新的社交机器人，更柔软，更人性化

行业人工智能

所以，能动手就别吵吵了

常用工具

火山写作

字节跳动旗下团队推出的免费AI英语写作助手

Stable Diffusion

StabilityAI推出的文本到图像生成AI

GitHub Copilot

GitHub AI编程工具

Adobe Firefly

Adobe最新推出的AI图片生成工具

文心一格

AI艺术和创意辅助平台

您尚未登录账户

请先登录您的atyun账户，方可使用该功能

仅限企业账户使用

该功能仅限企业账号使用，开通企业账号可享受更多服务，是否现在注册企业账号？

立即注册企业账号

暂不需要

您的企业账号申请正在审核中

审核通过后即可使用此功能，请耐心等待~

2023年12月22日由 camellia 发表 435 0

Bhaiyabot的最新AI模型rohansolo/BB-L-01-7B，在印地语、英语和印度英语的360k对话样本上进行了训练，根据创始人Rohan Shiralkar在LinkedIn上的帖子，它在所有基准测试中都超过了Sarvam AI的OpenHathi-7B、Meta Llama-7B以及即使是Mistral AI自己的微调模型，同时保持了基础模型的性能。

这个模型是在HuggingFaceH4/ultrachat_200k和rohansolo/BB_HindiHinglish数据集上对mistralai/Mistral-7B-v0.1进行微调的版本。在评估集上，它达到了以下结果：

Shiralkar说，印度的AI远远落后，而且在AI领域工作的公司太忙于营销非成就了。这包括微调一个模型并将其标记为预训练模型的活动（如Sarvam AI所做的），声称是印度第一个AI聊天机器人，尽管没有产品发布或发布（如BharatGPT -印度首个14种印度语言的AI（LLM）-文本、语音、视频），甚至捏造事实（如Krutrim）等等。

Shiralkar甚至对Ola最近启动的Krutrim提出了质疑。他在LinkedIn上写道：“Ola的Krutrim声称已经训练了一个2万亿token的LLM。而他们已经活跃了2周。这甚至足够训练一个微型模型2万亿token吗？”

此外，他说，新闻声称它已经比GPT-4更好，这是可笑的。“我想要一个印度的LLM。我为此哭泣了好久。这是一项战略性的命令。我只是想要一个真实的，不是为了筹资而捏造的。"他补充说。

文章来源：https://analyticsindiamag.com/bhaiyabots-llm-outperforms-openhathi-llama-2-and-mistral-7b/

标签：

LLM Bhaiyabot Lama 2

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇 Midjourney发布V6版本：实现超逼真图像生成

下一篇 ChatGPT推出存档功能：让你的聊天记录更整洁和安全

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

AGENTIC AI如何塑造未来