数据集:
shibing624/AdvertiseGen
数据集介绍
AdvertiseGen 是电商广告文案生成数据集。
AdvertiseGen 以商品网页的标签与文案的信息对应关系为基础构造,是典型的开放式生成任务,在模型基于 key-value 输入生成开放式文案时,与输入信息的事实一致性需要得到重点关注。
该数据集是为了生成电子商务广告而设计的。
AdvertiseGen 数据集中的数据为中文。
"train" 的一个示例如下所示:
{ "content": "类型#上衣*材质#牛仔布*颜色#白色*风格#简约*图案#刺绣*衣样式#外套*衣款式#破洞", "summary": "简约而不简单的牛仔外套,白色的衣身十分百搭。衣身多处有做旧破洞设计,打破单调乏味,增加一丝造型看点。衣身后背处有趣味刺绣装饰,丰富层次感,彰显别样时尚。" }
数据集引用
如在学术论文中使用本数据集,请添加相关引用说明,具体如下:
Shao, Zhihong, et al. "Long and Diverse Text Generation with Planning-based Hierarchical Variational Model." Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing and the 9th International Joint Conference on Natural Language Processing (EMNLP-IJCNLP). 2019.