模型:

cross-encoder/quora-distilroberta-base

英文

Quora重复问题检测的交叉编码器

该模型使用 SentenceTransformers Cross-Encoder 类进行训练。

训练数据

该模型在 Quora Duplicate Questions 数据集上进行训练。该模型将预测两个给定问题是重复的可能性得分,介于0和1之间。

注意:该模型不适用于估计问题的相似度,例如"如何学习Java"和"如何学习Python"这两个问题将得到较低的分数,因为它们不是重复的。

使用和性能

可以这样使用预训练模型:

from sentence_transformers import CrossEncoder
model = CrossEncoder('model_name')
scores = model.predict([('Question 1', 'Question 2'), ('Question 3', 'Question 4')])

也可以不使用sentence_transformers,只使用Transformers AutoModel类来使用该模型。