数据集:
TigerResearch/tigerbot-HC3-zh-12k
语言:
许可:
Tigerbot 基于公开的HC3数据集加工生成的常识问答sft数据集
原始来源: https://huggingface.co/datasets/Hello-SimpleAI/HC3
如果用于此语料库的源数据集具有比CC-BY-SA更严格的特定许可证,则我们的产品将遵循相同的许可证。如果没有,它们将遵循CC-BY-SA许可证。
import datasets
ds_sft = datasets.load_dataset('TigerResearch/tigerbot-HC3-zh-12k')