英文

lmqg/mt5-small-koquad-qg-ae 的模型卡片

此模型是基于 google/mt5-small 及其在 lmqg/qg_koquad (默认数据集)上进行的问题生成和答案提取的联合微调版本。

概述

用法

from lmqg import TransformersQG

# initialize model
model = TransformersQG(language="ko", model="lmqg/mt5-small-koquad-qg-ae")

# model prediction
question_answer_pairs = model.generate_qa("1990년 영화 《 남부군 》에서 단역으로 영화배우 첫 데뷔에 이어 같은 해 KBS 드라마 《지구인》에서 단역으로 출연하였고 이듬해 MBC 《여명의 눈동자》를 통해 단역으로 출연하였다.")
  • 使用 transformers
from transformers import pipeline

pipe = pipeline("text2text-generation", "lmqg/mt5-small-koquad-qg-ae")

# answer extraction
answer = pipe("generate question: 1990년 영화 《 <hl> 남부군 <hl> 》에서 단역으로 영화배우 첫 데뷔에 이어 같은 해 KBS 드라마 《지구인》에서 단역으로 출연하였고 이듬해 MBC 《여명의 눈동자》를 통해 단역으로 출연하였다.")

# question generation
question = pipe("extract answers: 또한 스피어스는 많은 새로운 여성 아티스트들에게 영향을 끼쳤는데, 대표적으로 데미 로바토, 케이티 페리, 크리스티니아 드바지, 레이디 가가, 리틀 부츠, 셀레나 고메즈 & 더씬, 픽시 로트 이 있다. 2007년 비욘세 놀스는 Total Request Live와의 인터뷰에서 '나는 브리트니를 사랑하고 팬이에요. 특히 새 앨범 Blackout을 좋아해요'라고 말했다. 린제이 로한은 '언제나 브리트니 스피어스에게 영감을 받는다. 학창시절 그녀처럼 타블로이드에 오르기를 꿈꿔왔다'고 말하며 롤 모델로 꼽았다. 스피어스는 현대 음악가들에게 음악적 영감으로 언급되기도 했다. <hl> 마일리 사이러스는 자신의 히트곡 Party in the U.S.A. 가 브리트니에게 영감과 영향을 받은 곡이라고 밝혔다. <hl> 베리 매닐로우의 앨범 15 Minutes 역시 브리트니에게 영감을 얻었다고 언급되었다.")

评估

Score Type Dataset
BERTScore 83.4 default 12313321
Bleu_1 25.91 default 12313321
Bleu_2 19.09 default 12313321
Bleu_3 14.37 default 12313321
Bleu_4 10.91 default 12313321
METEOR 27.52 default 12313321
MoverScore 82.54 default 12313321
ROUGE_L 25.83 default 12313321
Score Type Dataset
QAAlignedF1Score (BERTScore) 80.36 default 12313321
QAAlignedF1Score (MoverScore) 82.55 default 12313321
QAAlignedPrecision (BERTScore) 77.34 default 12313321
QAAlignedPrecision (MoverScore) 78.93 default 12313321
QAAlignedRecall (BERTScore) 83.72 default 12313321
QAAlignedRecall (MoverScore) 86.69 default 12313321
Score Type Dataset
AnswerExactMatch 80.78 default 12313321
AnswerF1Score 86.98 default 12313321
BERTScore 95.65 default 12313321
Bleu_1 75.14 default 12313321
Bleu_2 66.16 default 12313321
Bleu_3 53.61 default 12313321
Bleu_4 38.2 default 12313321
METEOR 59.91 default 12313321
MoverScore 94.61 default 12313321
ROUGE_L 82.32 default 12313321

训练超参数

在微调过程中使用了以下超参数:

  • 数据集路径:lmqg/qg_koquad
  • 数据集名称:default
  • 输入类型:['paragraph_answer', 'paragraph_sentence']
  • 输出类型:['question', 'answer']
  • 前缀类型:['qg', 'ae']
  • 模型:google/mt5-small
  • 最大长度:512
  • 最大输出长度:32
  • 迭代轮数:6
  • 批次大小:16
  • 学习率:0.001
  • fp16:False
  • 随机种子:1
  • 梯度累积步数:4
  • 标签平滑化:0.15

完整配置可在 fine-tuning config file 中找到。

引用

@inproceedings{ushio-etal-2022-generative,
    title = "{G}enerative {L}anguage {M}odels for {P}aragraph-{L}evel {Q}uestion {G}eneration",
    author = "Ushio, Asahi  and
        Alva-Manchego, Fernando  and
        Camacho-Collados, Jose",
    booktitle = "Proceedings of the 2022 Conference on Empirical Methods in Natural Language Processing",
    month = dec,
    year = "2022",
    address = "Abu Dhabi, U.A.E.",
    publisher = "Association for Computational Linguistics",
}