该数据集旨在进行对象检测任务,重点是检测移动UI设计中的元素。目标对象包括文本、图像和组。数据集包含图像和对象检测框,包括类别标签和位置信息。
加载数据集并查看示例:
>>> from datasets import load_dataset >>>> ds = load_dataset("mrtoy/mobile-ui-design") >>> example = ds[0] >>> example {'width': 375, 'height': 667, 'image': <PIL.JpegImagePlugin.JpegImageFile image mode=RGB size=375x667>, 'objects': {'bbox': [[0.0, 0.0, 375.0, 667.0], [0.0, 0.0, 375.0, 667.0], [0.0, 0.0, 375.0, 20.0], ... ], 'category': ['text', 'rectangle', 'rectangle', ...]}}
数据集包含以下字段:
您可以使用一些内部torch工具在图像上可视化边界框。
import torch from torchvision.ops import box_convert from torchvision.utils import draw_bounding_boxes from torchvision.transforms.functional import pil_to_tensor, to_pil_image item = ds[0] boxes_xywh = torch.tensor(item['objects']['bbox']) boxes_xyxy = box_convert(boxes_xywh, 'xywh', 'xyxy') to_pil_image( draw_bounding_boxes( pil_to_tensor(item['image']), boxes_xyxy, labels=item['objects']['category'], ) )
该数据集可用于各种应用,例如: