模型:
cross-encoder/quora-roberta-base
该模型使用 SentenceTransformers Cross-Encoder 类进行训练。
该模型是在 Quora Duplicate Questions 数据集上进行训练的。该模型将预测两个给定问题之间的重复程度,得分介于0和1之间。
注意:该模型不适用于估计问题的相似度,例如两个问题"How to learn Java"和"How to learn Python"的得分会比较低,因为它们并不是重复的。
预训练模型可按以下方式使用:
from sentence_transformers import CrossEncoder model = CrossEncoder('model_name') scores = model.predict([('Question 1', 'Question 2'), ('Question 3', 'Question 4')])
您还可以在不使用sentence_transformers的情况下,只使用Transformers AutoModel类来使用此模型。