登录注册

资讯

学习

基础知识理论实践学习教程

企业招聘

下载

模型数据集

AI工具箱

企业服务

EVA 智能HR 视频AI

ChatGPT 人工智能应用人工智能未来计算机视觉

热门新闻

行业人工智能

为什么数据污染对LLM来说是一个大问题

机器人康奈尔大学

康奈尔大学推出新的社交机器人，更柔软，更人性化

行业人工智能

所以，能动手就别吵吵了

常用工具

字节跳动旗下团队推出的免费AI英语写作助手

Stable Diffusion

StabilityAI推出的文本到图像生成AI

GitHub AI编程工具

Adobe最新推出的AI图片生成工具

AI艺术和创意辅助平台

您尚未登录账户

请先登录您的atyun账户，方可使用该功能

仅限企业账户使用

该功能仅限企业账号使用，开通企业账号可享受更多服务，是否现在注册企业账号？

立即注册企业账号

暂不需要

您的企业账号申请正在审核中

审核通过后即可使用此功能，请耐心等待~

模型:

Addedk/kbbert-distilled-cased

任务:

类库:

PyTorch TensorFlow Transformers

语言:

其他:

bert AutoTrain Compatible

预印本库:

arxiv:2103.06418

许可:

模型介绍文件清单

KB-BERT蒸馏基础模型（大小写敏感）

此模型是 KB-BERT 的蒸馏版本。它使用瑞典数据进行蒸馏，使用了 Swedish Culturomics Gigaword Corpus 的2010-2015部分。蒸馏过程的代码可以在 here 中找到。这是我的硕士论文的一部分： Task-agnostic knowledge distillation of mBERT to Swedish 。

模型描述

这是KB-BERT的6层版本，使用了 LightMBERT 的蒸馏方法，但没有冻结嵌入层。

预期用途和限制

您可以将原始模型用于掩码语言建模或下一个句子预测，但它主要用于在下游任务上进行微调。

训练数据

用于蒸馏的数据是 Swedish Culturomics Gigaword Corpus 的2010-2015部分。分词后的数据大小约为7.4 GB。

评估结果

在 SUCX 3.0 数据集上评估时，平均F1得分为0.887，与KB-BERT获得的0.894的得分相媲美。

更多结果和比较请参见我的硕士论文。

作者:

Added Kina

数据集大小:

776.78 MB

相关推荐