数据集:

jamescalam/unsplash-25k-photos

语言:

en

计算机处理:

monolingual

大小:

10K<n<100K

语言创建人:

found

批注创建人:

found
英文

Unsplash Lite数据集照片

此数据集与Unsplash Lite数据集相连,其中包含来自Unsplash的25K图像的数据。此处的数据集仅包含来自一个文件photos.tsv000的数据。数据集构建脚本直接从Unsplash 25K数据集源中流式传输此数据。

有关详细信息,请参阅 Unsplash Dataset GitHub repo ,或阅读下面的预览(从存储库复制)。

Unsplash数据集

Unsplash数据集由超过250,000+个全球摄影师和数据组成,数据来自近乎无限的用途和上下文中的数亿次搜索。由于Unsplash数据集内包含的意图和语义的广泛性,它为研究和学习提供了新的机会。

Unsplash数据集提供两个数据集:

  • Lite数据集:可用于商业和非商业用途,包含25k个以自然为主题的Unsplash照片,25k个关键词和1M个搜索
  • 完整数据集:仅可用于非商业用途,包含3M+高质量的Unsplash照片,5M个关键词和超过250M次搜索

随着Unsplash库的不断增长,我们将通过在每个后续版本中提供新字段和新图像来更新数据集 semantically versioned

我们欢迎任何关于数据集内容或格式的反馈。通过你们的反馈,我们希望缩小我们提供的数据与您希望利用的数据之间的差距。您可以使用链接 open an issue 报告问题或告诉我们希望在数据集的下一个版本中看到什么。

更多关于Unsplash数据集的信息,请参阅 our announcement site

下载

Lite数据集

Lite数据集包含与完整数据集相同的所有字段,但限制为约25,000张照片。您可以根据 the terms 的规定,无论是商业使用还是非商业使用均可使用。

⬇️ Download the Lite dataset [压缩后约650MB,原始大小约1.4GB]

完整数据集

完整数据集仅限于非商业使用,所有使用必须遵守 the terms 的规定。要访问,请访问 unsplash.com/data 并请求访问。该数据集压缩后大小为20GB(原始大小43GB)。

文档

请参阅 documentation for a complete list of tables and fields

用法

您可以按照以下示例以这些常见格式加载数据集:

共享您的工作

我们将这些数据开放和可用,希望能够让研究人员和开发人员在数据中发现有趣和有用的联系。

我们很想看到您创建的内容,无论是研究论文,机器学习模型,博客文章还是数据中的有趣发现。请发送电子邮件至data@unsplash.com。

如果您在研究论文中使用数据集,可以将数据集归因为Unsplash Lite数据集1.2.0或Unsplash完整数据集1.2.0,并链接到永久链接 unsplash.com/data

Unsplash数据集仅供研究目的。 It cannot be used to redistribute the images contained within 要在产品中使用Unsplash库,请参阅 the Unsplash API