模型:
castorini/tct_colbert-v2-hnp-msmarco-r2
此模型是为了复现TCT-ColBERT-V2稠密检索模型的一种变体,该模型在以下论文中进行了描述:
Sheng-Chieh Lin,Jheng-Hong Yang和Jimmy Lin。 In-Batch Negatives for Knowledge Distillation with Tightly-CoupledTeachers for Dense Retrieval. RepL4NLP 2021。
具体而言,这个检查点是针对MS MARCO-V2段落排名进行微调的,我们将这个检查点作为我们TREC DL 2021提交的“训练”模型。初始检查点来自之前用 MS MARCO 训练的检查点。对于微调,我们使用这个 script 构建我们的MS MARCO-V2段落排名训练数据。