数据集:
Vipitis/Shadertoys
Shadertoys 数据集包含从 Shadertoy.com API 收集的超过44k个渲染 passes。一些着色器程序包含多个渲染 passes。要浏览数据集的子集,请查看 ShaderEval 空间。此数据集的更细变体是 Shadertoys-fine 。
文本生成 - 数据集可用于训练生成式语言模型,用于代码补全任务。ShaderEval - 来自 ShaderEval 的 task1 使用从 Shadertoys 派生的数据集来测试自回归语言模型的返回补全。
数据点包括整个 shadercode,从 API 获取的一些信息以及其他元数据。
{ 'num_passes': 1, 'has_inputs': False, 'name': 'Image', 'type': 'image', 'code': '<full code>', 'title': '<title of the shader>', 'description': '<description of the shader>', 'tags': ['tag1','tag2','tag3', ... ], 'license': 'unknown', 'author': '<username>', 'source': 'https://shadertoy.com/view/<shaderID>' }
目前可用(随机顺序):
开始从2022年7月20日检索数据
所有数据是通过 Shadertoy.com API 进行收集的,然后在 'renderpass' 中迭代,同时添加了 'info' 中的一些字段。生成这些数据集的代码将很快发布到 GitHub 存储库中。
谁是源语言的生产者?Shadertoy.com 的贡献者将着色器发布为 'public+API'。
默认许可为 CC BY-NC-SA 3.0。然而,一些着色器可能附带不同的许可证。数据集当前不会筛选任何许可证,但会提供许可证标签,如果通过简单的手段可以轻易识别。请自行查看每个着色器程序的第一个评论,以避免侵犯版权用于后续使用。主要许可证要求共享和署名。每个数据字段的归属可以在 'author' 列中找到,但可能不包括代码本身的其他归属或来自分叉着色器的父级。