数据集:
winvoker/lvis
这个数据集是将LVIS数据集实现到Hugging Face datasets中的。请访问原始网站了解更多信息。
这段代码返回训练、验证和测试生成器。
from datasets import load_dataset dataset = load_dataset("winvoker/lvis")
Objects是一个包含注释信息(如bbox、class)的字典。
DatasetDict({ train: Dataset({ features: ['id', 'image', 'height', 'width', 'objects'], num_rows: 100170 }) validation: Dataset({ features: ['id', 'image', 'height', 'width', 'objects'], num_rows: 4809 }) test: Dataset({ features: ['id', 'image', 'height', 'width', 'objects'], num_rows: 19822 }) })
train = dataset["train"] validation = dataset["validation"] test = dataset["test"]
一个示例行如下所示。
{ 'id': 0, 'image': '000000437561.jpg', 'height': 480, 'width': 640, 'objects': { 'bboxes': [[[392, 271, 14, 3]], 'classes': [117], 'segmentation': [[376, 272, 375, 270, 372, 269, 371, 269, 373, 269, 373]] } }