模型:

castorini/tct_colbert-v2-hnp-msmarco-r2

英文

此模型是为了复现TCT-ColBERT-V2稠密检索模型的一种变体,该模型在以下论文中进行了描述:

Sheng-Chieh Lin,Jheng-Hong Yang和Jimmy Lin。 In-Batch Negatives for Knowledge Distillation with Tightly-CoupledTeachers for Dense Retrieval. RepL4NLP 2021。

具体而言,这个检查点是针对MS MARCO-V2段落排名进行微调的,我们将这个检查点作为我们TREC DL 2021提交的“训练”模型。初始检查点来自之前用 MS MARCO 训练的检查点。对于微调,我们使用这个 script 构建我们的MS MARCO-V2段落排名训练数据。