模型:

kykim/bertshared-kor-base

英文

韩文的Bert基础模型

  • 使用了70GB的韩文文本数据集和42000个小写的子词
  • 检查该模型在韩文中的性能以及其他韩文语言模型
# only for pytorch in transformers
from transformers import BertTokenizerFast, EncoderDecoderModel

tokenizer = BertTokenizerFast.from_pretrained("kykim/bertshared-kor-base")
model = EncoderDecoderModel.from_pretrained("kykim/bertshared-kor-base")