模型:

cross-encoder/quora-roberta-large

英文

Quora问题重复检测的交叉编码器

此模型是使用 SentenceTransformers Cross-Encoder 类进行训练的。

训练数据

此模型是在 Quora Duplicate Questions 数据集上进行训练的。该模型将预测给定的两个问题是否是重复的,预测结果是一个介于0和1之间的分数。

注意:该模型不适用于估算问题的相似度,例如两个问题“如何学习Java”和“如何学习Python”得分会相对较低,因为它们不是重复的。

用法和性能

预训练模型可以按照以下方式使用:

from sentence_transformers import CrossEncoder
model = CrossEncoder('model_name')
scores = model.predict([('Question 1', 'Question 2'), ('Question 3', 'Question 4')])

您还可以只使用Transformers AutoModel类,而无需使用sentence_transformers。