英文

该数据集包含6273个训练样本,762个验证样本和749个测试样本。每个样本代表一个句子,包括以下特征:句子ID('sent_id'),标记列表('tokens'),归一化词形列表('norms'),词形列表('lemmas'),Multext-East标记列表('xpos_tags'),形态特征列表('feats')和UPOS标记列表('upos_tags'),这些都被编码为类标签。