数据集:

kor_qpair

语言:

ko

计算机处理:

monolingual

大小:

1K<n<10K

语言创建人:

other

批注创建人:

expert-generated

源数据集:

original

许可:

mit
英文

数据集卡片:[数据集名称]

数据集概述

[需要更多信息]

支持的任务和排行榜

[需要更多信息]

语言

[需要更多信息]

数据集结构

数据示例

[需要更多信息]

数据字段

数据集中的每一行包含两个问题和一个is_duplicate标签。

  • question1:第一个问题
  • question2:第二个问题
  • is_duplicate:如果question1和question2在语义上相似则为0;否则为1

数据拆分

[需要更多信息]

数据集创建

策划理由

[需要更多信息]

来源数据

初始数据收集和规范化

[需要更多信息]

谁是源语言的生产者?

[需要更多信息]

注释

注释过程

[需要更多信息]

谁是注释者?

[需要更多信息]

个人信息和敏感信息

[需要更多信息]

使用数据的注意事项

数据集的社会影响

[需要更多信息]

偏见讨论

[需要更多信息]

其他已知限制

[需要更多信息]

其他信息

数据集策划者

[需要更多信息]

许可信息

[需要更多信息]

引用信息

[需要更多信息]

贡献

感谢 @jaketae 添加了此数据集。