登录注册

资讯

学习

基础知识理论实践学习教程

企业招聘

下载

模型数据集

AI工具箱

企业服务

EVA 智能HR 视频AI

ChatGPT 人工智能应用人工智能未来计算机视觉

热门新闻

行业人工智能

为什么数据污染对LLM来说是一个大问题

机器人康奈尔大学

康奈尔大学推出新的社交机器人，更柔软，更人性化

行业人工智能

所以，能动手就别吵吵了

常用工具

字节跳动旗下团队推出的免费AI英语写作助手

Stable Diffusion

StabilityAI推出的文本到图像生成AI

GitHub AI编程工具

Adobe最新推出的AI图片生成工具

AI艺术和创意辅助平台

您尚未登录账户

请先登录您的atyun账户，方可使用该功能

仅限企业账户使用

该功能仅限企业账号使用，开通企业账号可享受更多服务，是否现在注册企业账号？

立即注册企业账号

暂不需要

您的企业账号申请正在审核中

审核通过后即可使用此功能，请耐心等待~

模型:

valhalla/bart-large-finetuned-squadv1

任务:

类库:

PyTorch JAX Transformers

数据集:

其他:

bart AutoTrain Compatible

预印本库:

arxiv:1910.13461

模型介绍文件清单

BART-LARGE在SQuADv1上的微调

这是在SQuADv1数据集上微调的BART-LARGE模型，用于问答任务

模型详情

BART是在《BART:去噪序列到序列预训练用于自然语言生成、翻译和理解》中提出的。BART是一种用于自然语言生成和理解任务的序列到序列模型。

要将BART用于问答任务，我们将完整文档输入编码器和解码器，并使用解码器的顶部隐藏状态作为每个单词的表示。这个表示用于对标记进行分类。正如论文中所述，BART-LARGE在SQuAD上取得了与ROBERTa可比较的结果。BART的另一个显著特点是它可以处理长达1024个标记的序列。

模型训练

此模型在Google Colab的V100 GPU上进行了训练。可以在这里找到微调的Colab。

结果

实际结果略低于论文中给出的结果。论文中提到BART-LARGE实现了88.8的EM和94.6的F1。

模型展示 ?

由Suraj Patil❤️创建

作者:

Suraj Patil

数据集大小:

3.03 GB

相关推荐