数据集:
bond005/sberdevices_golos_10h_crowd
语言:
ru计算机处理:
monolingual大小:
10K<n<100K批注创建人:
expert-generated源数据集:
extended预印本库:
arxiv:2106.10161许可:
otherSberdevices Golos 是由 SberDevices 团队(Alexander Denisenko,Angelina Kovalenko,Fedor Minkin 和 Nikolay Karpov)准备的一个包含约1200小时的16kHz俄语语音的语料库,数据来自众包平台,并进行了手动注释。
作者将所有数据集分为训练子集和测试子集。训练子集包括约1000小时。对于仅包含有限记录的实验,作者确定了较短长度的训练子集:100小时,10小时,1小时,10分钟。
此数据集是上述 Golos 的简化版本:
语音为俄语。
典型的数据点由音频数据(通常称为audio)和其转录(称为transcription)组成。未提供任何关于发言者和包含转录的语段的额外信息。
{'audio': {'path': None, 'array': array([ 3.05175781e-05, 3.05175781e-05, 0.00000000e+00, ..., -1.09863281e-03, -7.93457031e-04, -1.52587891e-04]), dtype=float64), 'sampling_rate': 16000}, 'transcription': 'шестнадцатая часть сезона пять сериала лемони сникет тридцать три несчастья'}
此数据集是原始 Golos 的简化版本:
Train | Validation | Test | |
---|---|---|---|
examples | 7993 | 793 | 9994 |
hours | 8.9h | 0.9h | 11.2h |
[需要更多信息]
[需要更多信息]
谁是源语言生成者?[需要更多信息]
所有记录的音频文件都在众包平台上进行了手动注释。
谁是注释者?[需要更多信息]
该数据集由捐赠其声音的人组成。您同意不尝试确定数据集中发言者的身份。
[需要更多信息]
[需要更多信息]
[需要更多信息]
该数据集最初由 Alexander Denisenko,Angelina Kovalenko,Fedor Minkin 和 Nikolay Karpov 创建。
Public license with attribution and conditions reserved
@misc{karpov2021golos, author = {Karpov, Nikolay and Denisenko, Alexander and Minkin, Fedor}, title = {Golos: Russian Dataset for Speech Research}, publisher = {arXiv}, year = {2021}, url = {https://arxiv.org/abs/2106.10161} }
感谢 @bond005 添加此数据集。