数据集:

WizardLM/WizardLM_evol_instruct_V2_196k

英文

存储库: https://github.com/nlpxucan/WizardLM

推特: https://twitter.com/WizardLM_AI/status/1669364947606982656

此数据集包含Alpaca和ShareGPT的14.3万个混合进化数据。

这是WizardLM模型的Evol-Instruct训练数据的最新优化版本。

由于数据使用许可证,请将原始数据 ShareGPT 与此数据合并,以获得最终的完整数据集,大约包含19.6万行数据。