您必须手动下载数据集文件。您可以访问 this 页面或运行download.sh文件来获取文件。
之后,您可以通过引用目录加载数据集:
import datasets
ds = datasets.load_dataset("atasoglu/flickr8k-dataset", data_dir="data")
print(ds)
DatasetDict({
train: Dataset({
features: ['image_id', 'image_path', 'captions'],
num_rows: 6000
})
test: Dataset({
features: ['image_id', 'image_path', 'captions'],
num_rows: 1000
})
validation: Dataset({
features: ['image_id', 'image_path', 'captions'],
num_rows: 1000
})
})
我不拥有这些图像的版权。请 visit 获取更多信息。