模型:
naclbit/trin_tokenizer_v3
描述
一个为AI小说家的SuperTrin和Damsel 20B模型专门训练的日语SentencePiece分词器。
词汇量:52000(填充到52224)
概要
这是一个专门针对日语创意写作设计的SentencePiece分词器,用于AI小说家的"SuperTrin"和"Damsel 20B"模型。
词汇表大小:52000(填充到52224)
Wiki
AI小说家用户Wiki上有按照ABC / あいうえお的顺序列出的令牌列表。
收款MIT许可证