数据集:
pasinit/xlwic
任务:
文本分类计算机处理:
multilingual大小:
10K<n<100K语言创建人:
found批注创建人:
expert-generated源数据集:
original许可:
cc-by-nc-4.0XL-WiC论文的Huggingface数据集 https://www.aclweb.org/anthology/2020.emnlp-main.584.pdf 。请参考官方 website 以获取更多信息。
当加载XL-WSD数据集之一时,需要指定训练语言和目标语言(在该语言上进行开发和测试)。 请参考语言部分,查看可用的训练数据语言。例如,我们可以按以下方式加载以英语为训练语言,意大利语为目标语言的数据集:
from datasets import load_dataset dataset = load_dataset('pasinit/xlwic', 'en_it')
训练数据
开发和测试数据