数据集:
PlanTL-GOB-ES/UD_Spanish-AnCora
任务:
子任务:
part-of-speech语言:
计算机处理:
monolingual语言创建人:
found批注创建人:
expert-generated许可:
此数据集由从 AnCora corpus 投影到 Universal Dependencies treebank 的注释组成。我们将此语料库的POS注释用作EvalEs西班牙语语言基准的一部分。
POS标记
数据集为西班牙语(es-ES)
三个conllu文件。
注释以纯文本文件的形式编码(UTF-8,归一化为NFC,只使用LF字符作为换行符,在文件末尾包含一个LF字符),包含三种类型的行:
单词行包含以下字段:
来源: https://universaldependencies.org
[N/A]
最初的注释是作为巴塞罗那大学的 AnCora project 的一部分,在组织 Universal Dependencies team 的转换成依赖关系,并在CoNLL 2009共享任务中使用。 CoNLL 2009版本后来转换为HamleDT和Universal Dependencies。
有关AnCora项目的更多信息,请访问 AnCora site 。
要了解Universal Dependences,请访问网页 https://universaldependencies.org
谁是源语言生产者?有关AnCora语料库及其来源的更多信息,请访问 AnCora site 。
有关第一个AnCora注释的更多信息,请访问 AnCora site 。
谁是注释者?有关AnCora注释团队的更多信息,请访问 AnCora site 。
不包含个人或敏感信息。
该数据集有助于西班牙语语言模型的发展。
[N/A]
[N/A]
[N/A]
本作品根据 CC Attribution 4.0 International License 许可。
使用该语料库时必须引用以下论文:
Taulé, M., M.A. Martí, M. Recasens (2008) 'Ancora: Multilevel Annotated Corpora for Catalan and Spanish', Proceedings of 6th International Conference on Language Resources and Evaluation. Marrakesh (Morocco).
引用Universal Dependencies项目:
Rueter, J. (Creator), Erina, O. (Contributor), Klementeva, J. (Contributor), Ryabov, I. (Contributor), Tyers, F. M. (Contributor), Zeman, D. (Contributor), Nivre, J. (Creator) (15 Nov 2020). Universal Dependencies version 2.7 Erzya JR. Universal Dependencies Consortium.
[N/A]