数据集:
projecte-aina/wnli-ca
任务:
文本分类语言:
ca计算机处理:
monolingual语言创建人:
found批注创建人:
expert-generated源数据集:
extended|glue许可:
cc-by-4.0"Winograd模式是一对仅在一个或两个单词上有差异的句子,这些句子包含一个在两个句子中以相反方式解决的歧义,并且需要使用世界知识和推理来解决。该模式以Terry Winograd的名字命名。"来源: The Winograd Schema Challenge 。
该数据集共有855个句子配对,第一个句子中存在一个歧义,第二个句子是对其可能的解释。标签指示解释是否正确(1)或不正确(0)。
这个数据集是 GLUE Benchmark 中发布的 Winograd NLI dataset 的加泰罗尼亚语专业翻译。
原始数据集和此翻译都在 Creative Commons Attribution 4.0 International License 下获得许可。
文本蕴含、文本分类、语言模型。
该数据集使用加泰罗尼亚语(ca-CA)。
三个tsv文件。
index | sentence 1 | sentence 2 | label |
---|---|---|---|
0 | Vaig clavar una agulla en una pastanaga. Quan la vaig treure, tenia un forat. | La pastanaga tenia un forat. | 1 |
1 | En Joan no podia veure l’escenari amb en Guillem davant seu perquè és molt baix. | En Joan és molt baix. | 1 |
2 | Els policies van arrestar tots els membres de la banda. Volien aturar el tràfic de drogues del barri. | Els policies volien aturar el tràfic de drogues del barri. | 1 |
3 | L’Esteve segueix els passos d’en Frederic en tot. L’influencia moltíssim. | L’Esteve l’influencia moltíssim. | 0 |
我们翻译了这个数据集,以促进加泰罗尼亚语的语言模型的发展,加泰罗尼亚语是一种资源稀缺的语言,并且可以进行跨语言比较。
这是 WNLI dataset 的加泰罗尼亚语专业翻译,由BSC TeMU在 Projecte AINA 中委托完成。
有关Winograd NLI数据集的创建方式的更多信息,请访问网页 The Winograd Schema Challenge 。
谁是源语言的制作人?有关Winograd NLI数据集的创建方式的更多信息,请访问网页 The Winograd Schema Challenge 。
我们委托专业翻译将 WNLI dataset 翻译成加泰罗尼亚语。
谁是标注者?翻译是由专业翻译人员完成的。
不包含个人或敏感信息。
该数据集有助于加泰罗尼亚语的语言模型的发展,这是一种资源稀缺的语言。
[N/A]
[N/A]
巴塞罗那超级计算中心(BSC)的文本挖掘单元(TeMU)(bsc-temu@bsc.es)。
该工作是在 Projecte AINA 框架内,由 Departament de la Vicepresidència i de Polítiques Digitals i Territori de la Generalitat de Catalunya 资助完成的。
该工作根据 CC Attribution 4.0 International License 获得许可。
[N/A]