数据集:
WizardLM/WizardLM_evol_instruct_V2_196k
存储库: https://github.com/nlpxucan/WizardLM
推特: https://twitter.com/WizardLM_AI/status/1669364947606982656
此数据集包含Alpaca和ShareGPT的14.3万个混合进化数据。
这是WizardLM模型的Evol-Instruct训练数据的最新优化版本。
由于数据使用许可证,请将原始数据 ShareGPT 与此数据合并,以获得最终的完整数据集,大约包含19.6万行数据。