模型:

zedfum/arman-longformer-8k

英文

Model arman-longformer-8k 的模型卡片

这个项目使用了Longformer的注意机制来处理长文档并进行抽象摘要生成。新的模型可以处理8K个标记(而不是512个标记),它应该被微调以用于摘要生成任务。

转换代码可在 github repository 中找到。