数据集:

argilla/dolly-curated-comparison-falcon-7b-instruct

语言:

en
英文

《dolly-curated-comparison-falcon-7b-instruct》数据集卡片

该数据集包含使用falcon-7b-instruct模型生成的两个回答以及Dolly v2精选数据集中的原始标题+回答。目前仅提供了原始数据集的50%,但计划会将其完善。

该数据集可用于使用 Argilla Feedback 对RLHF进行奖励模型训练。

More Information needed