数据集:

KTH/hungarian-single-speaker-tts

语言:

hu

计算机处理:

monolingual

大小:

1K<n<10K

批注创建人:

expert-generated

源数据集:

original

预印本库:

arxiv:1903.11269

许可:

cc0-1.0
英文

CSS10 Hungarian:单个说话者语音数据集数据卡

数据集概述

该语料库由一个单个说话者组成,包括从一本LibriVox有声读物中提取的4515个片段。

支持的任务和排行榜

[需要更多信息]

语言

音频为匈牙利语。

数据集结构

[需要更多信息]

数据实例

[需要更多信息]

数据字段

[需要更多信息]

数据拆分

[需要更多信息]

数据集创建

策划理由

CSS10 是10种语言的单个说话者语音数据集的集合。每个数据集由一个志愿者录制的音频文件和从LibriVox获取的对应文本组成。

源数据

初始数据收集和规范化

Egri csillagok ,由Diana Majlinger朗读。

谁是源语言的制作人?

[需要更多信息]

注释

注释过程

[需要更多信息]

谁是注释者?

[需要更多信息]

个人和敏感信息

[需要更多信息]

使用数据的注意事项

数据的社会影响

[需要更多信息]

偏见讨论

[需要更多信息]

其他已知限制

[需要更多信息]

附加信息

数据集策划者

Kyubyong Park & Tommy Mulc

许可信息

CC0: Public Domain

引用信息

@article{park2019css10,
  title={CSS10: A Collection of Single Speaker Speech Datasets for 10 Languages},
  author={Park, Kyubyong and Mulc, Thomas},
  journal={Interspeech},
  year={2019}
}

贡献

[需要更多信息]