数据集:
alexandrainst/ddisco
任务:
文本分类语言:
da计算机处理:
monolingual大小:
1K<n<10K语言创建人:
expert-generated批注创建人:
expert-generated许可:
afl-3.0DDisco数据集是一个可以用来训练模型以分类丹麦语篇的连贯性水平的数据集。数据集中的每个条目都标有一个篇章连贯性等级(评分从1到3):
1:低连贯性(难以理解,组织混乱,包含不必要的细节,不能简洁明了地概括)2:中等连贯性3:高连贯性(易于理解,组织良好,只包含支持主要观点的细节,可以简洁明了地概括)。语法和打字错误被忽略(即它们不会影响连贯性评分),文本的连贯性被考虑在其自身的领域内。
DDisCo: A Discourse Coherence Dataset for Danish