模型:

cross-encoder/quora-roberta-base

英文

Quora重复问题检测的交叉编码器

该模型使用 SentenceTransformers Cross-Encoder 类进行训练。

训练数据

该模型是在 Quora Duplicate Questions 数据集上进行训练的。该模型将预测两个给定问题之间的重复程度,得分介于0和1之间。

注意:该模型不适用于估计问题的相似度,例如两个问题"How to learn Java"和"How to learn Python"的得分会比较低,因为它们并不是重复的。

使用和性能

预训练模型可按以下方式使用:

from sentence_transformers import CrossEncoder
model = CrossEncoder('model_name')
scores = model.predict([('Question 1', 'Question 2'), ('Question 3', 'Question 4')])

您还可以在不使用sentence_transformers的情况下,只使用Transformers AutoModel类来使用此模型。