模型:
lmqg/mt5-small-jaquad-qg-ae
该模型是在 google/mt5-small 的基础上,通过 lmqg 在 lmqg/qg_jaquad (数据集名称: 默认)上进行了同时生成问题和提取答案的微调版本。
from lmqg import TransformersQG # initialize model model = TransformersQG(language="ja", model="lmqg/mt5-small-jaquad-qg-ae") # model prediction question_answer_pairs = model.generate_qa("フェルメールの作品では、17世紀のオランダの画家、ヨハネス・フェルメールの作品について記述する。フェルメールの作品は、疑問作も含め30数点しか現存しない。現存作品はすべて油彩画で、版画、下絵、素描などは残っていない。")
from transformers import pipeline pipe = pipeline("text2text-generation", "lmqg/mt5-small-jaquad-qg-ae") # answer extraction answer = pipe("generate question: ゾフィーは貴族出身ではあったが王族出身ではなく、ハプスブルク家の皇位継承者であるフランツ・フェルディナントとの結婚は貴賤結婚となった。皇帝フランツ・ヨーゼフは、2人の間に生まれた子孫が皇位を継がないことを条件として結婚を承認していた。視察が予定されている<hl>6月28日<hl>は2人の14回目の結婚記念日であった。") # question generation question = pipe("extract answers: 『クマのプーさん』の物語はまず1925年12月24日、『イヴニング・ニュース』紙のクリスマス特集号に短編作品として掲載された。これは『クマのプーさん』の第一章にあたる作品で、このときだけは挿絵をJ.H.ダウドがつけている。その後作品10話と挿絵が整い、刊行に先駆けて「イーヨーの誕生日」のエピソードが1926年8月に『ロイヤルマガジン』に、同年10月9日に『ニューヨーク・イヴニング・ポスト』紙に掲載されたあと、同年10月14日にロンドンで(メシュエン社)、21日にニューヨークで(ダットン社)『クマのプーさん』が刊行された。<hl>前著『ぼくたちがとてもちいさかったころ』がすでに大きな成功を収めていたこともあり、イギリスでは初版は前著の7倍に当たる3万5000部が刷られた。<hl>他方のアメリカでもその年の終わりまでに15万部を売り上げている。ただし依然として人気のあった前著を売り上げで追い越すには数年の時間を要した。")
Score | Type | Dataset | |
---|---|---|---|
BERTScore | 81.64 | default | 12313321 |
Bleu_1 | 56.94 | default | 12313321 |
Bleu_2 | 45.23 | default | 12313321 |
Bleu_3 | 37.37 | default | 12313321 |
Bleu_4 | 31.55 | default | 12313321 |
METEOR | 29.64 | default | 12313321 |
MoverScore | 59.42 | default | 12313321 |
ROUGE_L | 52.58 | default | 12313321 |
Score | Type | Dataset | |
---|---|---|---|
QAAlignedF1Score (BERTScore) | 80.51 | default | 12313321 |
QAAlignedF1Score (MoverScore) | 56.28 | default | 12313321 |
QAAlignedPrecision (BERTScore) | 80.51 | default | 12313321 |
QAAlignedPrecision (MoverScore) | 56.28 | default | 12313321 |
QAAlignedRecall (BERTScore) | 80.51 | default | 12313321 |
QAAlignedRecall (MoverScore) | 56.28 | default | 12313321 |
Score | Type | Dataset | |
---|---|---|---|
AnswerExactMatch | 29.55 | default | 12313321 |
AnswerF1Score | 29.55 | default | 12313321 |
BERTScore | 78.12 | default | 12313321 |
Bleu_1 | 34.96 | default | 12313321 |
Bleu_2 | 31.92 | default | 12313321 |
Bleu_3 | 29.49 | default | 12313321 |
Bleu_4 | 27.55 | default | 12313321 |
METEOR | 26.22 | default | 12313321 |
MoverScore | 65.68 | default | 12313321 |
ROUGE_L | 36.63 | default | 12313321 |
在微调期间使用了以下超参数:
完整的配置可以在 fine-tuning config file 找到。
@inproceedings{ushio-etal-2022-generative, title = "{G}enerative {L}anguage {M}odels for {P}aragraph-{L}evel {Q}uestion {G}eneration", author = "Ushio, Asahi and Alva-Manchego, Fernando and Camacho-Collados, Jose", booktitle = "Proceedings of the 2022 Conference on Empirical Methods in Natural Language Processing", month = dec, year = "2022", address = "Abu Dhabi, U.A.E.", publisher = "Association for Computational Linguistics", }