数据集:

fscheffczyk/20newsgroups_embeddings

英文

20newsgroup数据集特征向量嵌入的数据集卡片

数据集概述

数据集包含了 20newsgroups dataset 个特征向量嵌入。这些嵌入是使用 multi-qa-MiniLM-L6-cos-v1 模型和 Sentence Transformers library 进行创建的。

支持的任务和排行榜

[需要更多信息]

语言

[需要更多信息]

数据集结构

数据实例

[需要更多信息]

数据字段

[需要更多信息]

数据拆分

[需要更多信息]

数据集创建

配置理由

[需要更多信息]

数据源

初始数据收集和规范化

[需要更多信息]

谁是源语言制作人?

[需要更多信息]

注释

注释过程

[需要更多信息]

谁是注释者?

[需要更多信息]

个人和敏感信息

[需要更多信息]

使用数据的注意事项

数据的社会影响

[需要更多信息]

偏见讨论

[需要更多信息]

其他已知限制

[需要更多信息]

其他信息

数据集维护者

[需要更多信息]

许可信息

[需要更多信息]

引用信息

[需要更多信息]

贡献

感谢 @github-username 添加了这个数据集。