登录注册

资讯

学习

基础知识理论实践学习教程

企业招聘

下载

模型数据集

AI工具箱

企业服务

EVA 智能HR 视频AI

ChatGPT 人工智能应用人工智能未来计算机视觉

热门新闻

行业人工智能

为什么数据污染对LLM来说是一个大问题

机器人康奈尔大学

康奈尔大学推出新的社交机器人，更柔软，更人性化

行业人工智能

所以，能动手就别吵吵了

常用工具

字节跳动旗下团队推出的免费AI英语写作助手

Stable Diffusion

StabilityAI推出的文本到图像生成AI

GitHub AI编程工具

Adobe最新推出的AI图片生成工具

AI艺术和创意辅助平台

您尚未登录账户

请先登录您的atyun账户，方可使用该功能

仅限企业账户使用

该功能仅限企业账号使用，开通企业账号可享受更多服务，是否现在注册企业账号？

立即注册企业账号

暂不需要

您的企业账号申请正在审核中

审核通过后即可使用此功能，请耐心等待~

模型:

Naveen-k/KanBERTo

任务:

类库:

PyTorch JAX Transformers

语言:

其他:

roberta AutoTrain Compatible

模型介绍文件清单

欢迎使用KanBERTo (ಕನ್ಬರ್ಟೋ)

模型描述

这是一个使用 Kannada 种语言训练的小型语言模型，其中使用了来自 OSCAR page 的100万个数据样本。

训练参数

数据集 - 训练此模型使用了来自OSCAR页面（ https://traces1.inria.fr/oscar/ ）的100万个数据样本，尽管数据集达到1.7GB，但由于资源限制，只选择了100万个数据样本进行训练。如果您有兴趣合作并且拥有计算资源进行训练，欢迎这样做。
预处理 - 使用ByteLevelBPETokenizer对句子进行字符级分词处理，词汇量大小设置为52k，符合?给出的标准值。
超参数 - ByteLevelBPETokenizer: 词汇量大小=52,000，最小频率=2 Trainer: num_train_epochs=12-训练12个epochs per_gpu_train_batch_size=64-数据样本的批量大小为64 save_steps=10_000-每10k步保存一次模型 save_total_limit=2-保存模型的限制为2

预期用途和限制 - 该模型适用于任何希望在卡纳达语上进行语言生成、翻译等各种任务的人。

其他有用信息！如果您有兴趣合作，请随时与我联系Naveen

作者:

Naveen_Kashyap

数据集大小:

961.92 MB

相关推荐