模型:
sentence-transformers/sentence-t5-xl
这是一个 sentence-transformers 模型:它将句子和段落映射到一个768维的密集向量空间。该模型在句子相似性任务中表现良好,但在语义搜索任务中表现不佳。
这个模型是从Tensorflow模型 st5-3b-1 转换为PyTorch模型的。在使用该模型时,请参考 Sentence-T5: Scalable sentence encoders from pre-trained text-to-text models 的出版物。即使tfhub模型和这个PyTorch模型在同一基准测试上产生的嵌入略有不同,但它们产生的结果是相同的。
该模型仅使用了T5-3B模型的编码器。权重以FP16存储。
安装了 sentence-transformers 后,使用该模型变得很容易:
pip install -U sentence-transformers
然后可以像这样使用模型:
from sentence_transformers import SentenceTransformer sentences = ["This is an example sentence", "Each sentence is converted"] model = SentenceTransformer('sentence-transformers/sentence-t5-xl') embeddings = model.encode(sentences) print(embeddings)
该模型需要sentence-transformers 2.2.0或更新版本。
对于该模型的自动评估,请参见句子嵌入基准测试: https://seb.sbert.net
如果您发现该模型有帮助,请引用相应的出版物: Sentence-T5: Scalable sentence encoders from pre-trained text-to-text models