数据集:
kor_ner
任务:
标记分类语言:
ko计算机处理:
monolingual大小:
1K<n<10K语言创建人:
other批注创建人:
expert-generated源数据集:
original许可:
mit[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
每行包括以下字段:
需要注意的是,设计上,tokens、pos_tags和ner_tags的长度始终相等。
pos_tags 对应以下列表:
['SO', 'SS', 'VV', 'XR', 'VCP', 'JC', 'VCN', 'JKB', 'MM', 'SP', 'XSN', 'SL', 'NNP', 'NP', 'EP', 'JKQ', 'IC', 'XSA', 'EC', 'EF', 'SE', 'XPN', 'ETN', 'SH', 'XSV', 'MAG', 'SW', 'ETM', 'JKO', 'NNB', 'MAJ', 'NNG', 'JKV', 'JKC', 'VA', 'NR', 'JKG', 'VX', 'SF', 'JX', 'JKS', 'SN']
ner_tags 对应以下标记:
["I", "O", "B_OG", "B_TI", "B_LC", "B_DT", "B_PS"]
前缀 B 表示短语的第一个单词,I 表示非初始单词。此外,OG 表示机构;TI 表示时间;DT 表示日期;PS 表示人名。
[需要更多信息]
[需要更多信息]
[需要更多信息]
语言生成者是谁?[需要更多信息]
[需要更多信息]
注释者是谁?[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
感谢 @jaketae 添加了这个数据集。