数据集:
lambdalabs/naruto-blip-captions
用于训练TBD的数据集。
原始图像来自 narutopedia.com ,并使用 pre-trained BLIP model 添加了字幕。
对于每一行,数据集包含图像和文本键。图像是可变大小的PIL jpeg格式,文本是相应的字幕。仅提供训练集。
"戴帽子的比尔·盖茨", "约翰·奥利弗以火影忍者风格", "Hello Kitty以火影忍者风格", "戴帽子的勒布朗·詹姆斯", "迈克尔·杰克逊作为忍者", "银行街头艺术中的忍者"
如果您使用了此数据集,请引用如下:
@misc{cervenka2022naruto2, author = {Cervenka, Eole}, title = {Naruto BLIP captions}, year={2022}, howpublished= {\url{https://huggingface.co/datasets/lambdalabs/naruto-blip-captions/}} }