数据集:

alexandrainst/ddisco

语言:

da

计算机处理:

monolingual

大小:

1K<n<10K

语言创建人:

expert-generated

批注创建人:

expert-generated

许可:

afl-3.0
英文

DDisco数据集数据卡

数据集描述

DDisco数据集是一个可以用来训练模型以分类丹麦语篇的连贯性水平的数据集。数据集中的每个条目都标有一个篇章连贯性等级(评分从1到3):

1:低连贯性(难以理解,组织混乱,包含不必要的细节,不能简洁明了地概括)2:中等连贯性3:高连贯性(易于理解,组织良好,只包含支持主要观点的细节,可以简洁明了地概括)。语法和打字错误被忽略(即它们不会影响连贯性评分),文本的连贯性被考虑在其自身的领域内。

附加信息

DDisCo: A Discourse Coherence Dataset for Danish

贡献

@ajders