模型:
pszemraj/long-t5-tglobal-xl-16384-book-summary-8bit
这是 a 根据8位量化的版本,基于 pszemraj/long-t5-tglobal-xl-16384-book-summary 模型。该模型已经通过 bitsandbytes 进行压缩,可以在低内存使用情况下加载。
了解有关模型架构和训练过程的所有详细信息,请参阅 original model 。有关加载8位模型的更多信息,请参阅 4.28.0 release information 和 example repository 。
要使用该模型,请安装或升级 transformers、accelerate 和 bitsandbytes。确保具有 transformers>=4.28.0 和 bitsandbytes>=0.37.2。
对于加载模型,请使用 AutoTokenizer 和 AutoModelForSeq2SeqLM:from transformers import AutoTokenizer, AutoModelForSeq2SeqLM model_name = "pszemraj/long-t5-tglobal-xl-16384-book-summary-8bit" tokenizer = AutoTokenizer.from_pretrained(model_name) model = AutoModelForSeq2SeqLM.from_pretrained(model_name)