针对越南语的第一个GPT模型
GPT-Neo-vi-small 是一个使用EleutherAI对GPT-3架构进行复制设计的变换器模型。
GPT-Neo-vi-small是通过新闻网站的数据集进行训练的,该数据集是为了训练该模型而创建的大型数据集。
这个示例每次运行时会生成一个不同的序列:
from transformers import GPTNeoForCausalLM, GPT2Tokenizer model = GPTNeoForCausalLM.from_pretrained("NlpHUST/gpt-neo-vi-small") tokenizer = GPT2Tokenizer.from_pretrained("NlpHUST/gpt-neo-vi-small") prompt = "Ngay sau Tết Nguyên đán Tân Sửu, hiện tượng giá đất tăng tại nhiều địa phương. Thị trường nhộn nhịp, tạo ra những cơn sóng sốt đất khó tin khiến bộ ngành, địa phương đưa cảnh báo." input_ids = tokenizer(prompt, return_tensors="pt").input_ids gen_tokens = model.generate(input_ids, do_sample=True, temperature=1.0, max_length=1024) gen_text = tokenizer.batch_decode(gen_tokens)[0] print(gen_text)
如果需要与该项目相关的个人交流,请联系Nha Nguyen Van(nha282@gmail.com)。