英文

这个模型在Qazaq数据集上进行训练,训练了 T5-V1_1-base 个样本。注意,原始配置略有改变(dropout设置为0)。

官方的 run_t5_mlm_flax.py 被复制到仓库中,并使用run_t5.sh中定义的超参数运行。