模型:

sonoisa/t5-base-japanese-question-generation

英文

回答和回答出现的段落给出模型生成问题句子

SEE: https://github.com/sonoisa/deep-question-generation

本模型的创建步骤概述

  • SQuAD 1.1 翻译成日语,并清理掉无效数据(有效数据约占一半)。这样就可以得到包含回答的上下文、问题句子和答案的三元组。
  • 使用以下设置对 日本語T5モデル 进行微调
    • 输入:"answer: {答案} content: {包含回答的上下文}"
    • 输出:"输出:{问题句子}"
    • 各种超参数
      • 最大输入token数:512
      • 最大输出token数:64
      • 优化算法:AdaFactor
      • 学习率:0.001(固定)
      • 批量大小:128
      • 步数:2500(每500步输出一次检查点,进行定量和定性评估,并采用第2500步)