版本1.0(我将继续改进模型的性能。)
版本2.0在这里!(当然,改善了性能)
我训练了比v1多13倍的数据。
ROUGE-1:44.5252
ROUGE-2:22.652
ROUGE-L:29.8866
这个模型是一个T5变压器模型(JDBN/t5-base-fr-qg-fquad),在法语中进行了抽象文本摘要。
from transformers import T5Tokenizer, T5ForConditionalGeneration tokenizer = T5Tokenizer.from_pretrained("plguillou/t5-base-fr-sum-cnndm") model = T5ForConditionalGeneration.from_pretrained("plguillou/t5-base-fr-sum-cnndm")
要对一个文章进行摘要,只需修改字符串如下:"summarize:ARTICLE"。
我使用的基础模型是JDBN/t5-base-fr-qg-fquad(它可以执行问题生成、问题回答和答案提取)。
我使用transformers库中的"t5-base"模型来将CNN / Daily Mail摘要数据集翻译成法语。