数据集:
dbdu/ShareGPT-74k-ko
ShareGPT-90k的清理版本经由Google翻译转换成韩文。您可以在原始数据集 여기 中查看原始数据集。
ShareGPT-90k的韩文翻译版本,由Google翻译转换而来。您可以在原始数据集 here 中查看原始数据集。
json文件的结构与原始数据集相同。*_unclneaed.json为韩文翻译数据,未经任何后处理。总计74k个对话。*_clneaed.json为经过后处理的版本,删除了包含代码片段的对话。总计55k个对话。请注意:由于代码可能已被翻译成韩文,建议使用cleaned文件。
数据集的许可证信息:由于包含了GPT生成的句子,因此遵循OPENAI的 약관 。对于其他情况,遵循 CC BY 2.0 KR 的许可证状态。
您可以使用下面的存储库将ShareGPT类似的数据集翻译成您选择的语言。