数据集:

finer

语言:

fi

计算机处理:

monolingual

大小:

10K<n<100K

语言创建人:

other

批注创建人:

expert-generated

源数据集:

original

预印本库:

arxiv:1908.04212

许可:

mit
英文

[数据集名称] 数据集卡片

数据集摘要

[需要更多信息]

支持的任务和排行榜

[需要更多信息]

语言

[需要更多信息]

数据集结构

数据实例

[需要更多信息]

数据字段

每行包含以下字段:

  • id:句子ID
  • tokens:全文的令牌有序列表
  • ner_tags:每个令牌的命名实体识别标签
  • nested_ner_tags:每个令牌的嵌套命名实体识别标签

注意,根据设计,tokens、ner_tags和nested_ner_tags的长度将始终相同。

ner_tags和nested_ner_tags对应于以下列表:

[ "O", "B-DATE", "B-EVENT", "B-LOC", "B-ORG", "B-PER", "B-PRO", "I-DATE", "I-EVENT", "I-LOC", "I-ORG", "I-PER", "I-PRO" ]

使用IOB2标记方案。

数据拆分

[需要更多信息]

数据集创建

策划理由

[需要更多信息]

源数据

初始数据收集和规范化

[需要更多信息]

谁是源语言的生产者?

[需要更多信息]

注释

注释过程

[需要更多信息]

谁是标注者?

[需要更多信息]

个人和敏感信息

[需要更多信息]

使用数据的注意事项

数据集的社会影响

[需要更多信息]

偏见讨论

[需要更多信息]

其他已知限制

[需要更多信息]

附加信息

数据集策划者

[需要更多信息]

许可信息

[需要更多信息]

引用信息

[需要更多信息]

贡献

感谢 @stefan-it 添加了这个数据集。