数据集:

osunlp/MagicBrush

英文

数据集名称的数据集卡片

数据集摘要

MagicBrush是第一个大规模手动注释的指导图像编辑数据集,涵盖了单一轮次、多轮次、提供蒙版和无蒙版编辑的多种情景。MagicBrush包含了10K个(源图像,指令,目标图像)三元组,足以训练大规模的图像编辑模型。

请查看我们的 website 来了解更多的可视化结果。

数据集结构

"img_id"(str):与COCO id相同,但为字符串类型,便于加载测试集

"turn_index"(int32):图像中的编辑轮次

"source_img"(str):输入图像,可以是原始真实图像(turn_index=1)和上一轮的编辑图像(turn_index >=2)

"mask_img"(str):自由形式的蒙版图像(白色区域),可以在提供蒙版的设置中使用以限制要编辑的区域。

"instruction"(str):如何对输入图像进行编辑的指令。

"target_img"(str):对应于输入图像和指令的编辑后的图像。

如果需要辅助数据,请使用 training set dev set

分割

训练集:8,807个编辑轮次(4,512个编辑会话)。验证集:528个编辑轮次(266个编辑会话)。测试集:(为防止潜在的数据泄露,请查阅我们的库获取有关获取测试集的信息。)

许可信息

知识共享许可协议本作品采用知识共享署名4.0国际许可协议进行许可。

引用信息

如果您发现此数据集有用,请考虑引用我们的论文:

@misc{Zhang2023MagicBrush,
      title={MagicBrush: A Manually Annotated Dataset for Instruction-Guided Image Editing}, 
      author={Kai Zhang and Lingbo Mo and Wenhu Chen and Huan Sun and Yu Su},
      year={2023},
      eprint={2306.10012},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}