数据集:

openslr

任务:

自动语音识别

语言:

计算机处理:

multilingual

大小:

1K<n<10K

语言创建人:

found

批注创建人:

found

源数据集:

original

许可:

cc-by-sa-4.0

数据集介绍文件清单

英文

openslr 数据集卡片

数据集概述

OpenSLR 是一个致力于托管语音和语言资源（如语音识别的训练语料库）和与语音识别相关的软件的网站。目前，可用的资源如下：

SLR32: 南非四种语言（af、st、tn、xh）的高质量语音合成数据。

该数据集包含南非四种语言的多说者高质量的转录音频数据。数据集由波形文件和一个TSV文件组成，其中每个文件夹的文件line_index.tsv包含一个FileID，该FileID包含用户ID和文件中音频的转录。

数据集已经进行了一些质量检查，但仍可能存在错误。

该数据集是由南非西北大学（North West University）和谷歌（Google）合作收集的。

该数据集在知识共享署名-相同方式共享 4.0 国际公共许可证下分发。有关许可信息，请参阅 https://github.com/google/language-resources#license 。

SLR35: 大规模爪哇语自动语音识别训练数据集。

该数据集包含篇章爪哇语的转录音频数据（约185K个断句）。数据集由波形文件和一个TSV文件组成，其中的文件utt_spk_text.tsv包含文件的FileID、UserID以及文件中音频的转录。

数据集已经手动质量检查，但仍可能存在错误。

该数据集是由谷歌与冰岛大学（Reykjavik University）和印度尼西亚加德满都大学（Universitas Gadjah Mada）合作收集的。

该数据集在知识共享署名-相同方式共享 4.0 国际公共许可证下分发。有关许可信息，请参阅 LICENSE 文件和 https://github.com/google/language-resources#license 。

SLR36: 大规模巽他语自动语音识别训练数据集。

该数据集包含巽他语的转录音频数据（约220K个断句）。数据集由波形文件和一个TSV文件组成，其中的文件utt_spk_text.tsv包含文件的FileID、UserID以及文件中音频的转录。

数据集已经手动质量检查，但仍可能存在错误。

该数据集是由谷歌在印度尼西亚收集的。

该数据集在知识共享署名-相同方式共享 4.0 国际公共许可证下分发。有关许可信息，请参阅 LICENSE 文件和 https://github.com/google/language-resources#license 。

SLR41: 爪哇语高质量语音合成数据集。

该数据集包含爪哇语的高质量转录音频数据。数据集由波形文件和一个TSV文件组成，其中的文件line_index.tsv包含文件名和文件中音频的转录。每个文件名都以说话者识别号作为前缀。

数据集已经手动质量检查，但仍可能存在错误。

该数据集是由谷歌与印度尼西亚加德满都大学合作收集的。

该数据集在知识共享署名-相同方式共享 4.0 国际公共许可证下分发。有关许可信息，请参阅 LICENSE 文件和 https://github.com/google/language-resources#license 。

SLR42: 柬埔寨语高质量语音合成数据集。

该数据集包含柬埔寨语的高质量转录音频数据。数据集由波形文件和一个TSV文件组成，其中的文件line_index.tsv包含文件名和文件中音频的转录。每个文件名都以说话者识别号作为前缀。

数据集已经手动质量检查，但仍可能存在错误。

该数据集是由谷歌收集的。

该数据集在知识共享署名-相同方式共享 4.0 国际公共许可证下分发。有关许可信息，请参阅 LICENSE 文件和 https://github.com/google/language-resources#license 。

SLR43: 尼泊尔语高质量语音合成数据集。

该数据集包含尼泊尔语的高质量转录音频数据。数据集由波形文件和一个TSV文件组成，其中的文件line_index.tsv包含文件名和文件中音频的转录。每个文件名都以说话者识别号作为前缀。

数据集已经手动质量检查，但仍可能存在错误。

该数据集是由谷歌在尼泊尔收集的。

该数据集在知识共享署名-相同方式共享 4.0 国际公共许可证下分发。有关许可信息，请参阅 LICENSE 文件和 https://github.com/google/language-resources#license 。

SLR44: 巽他语高质量语音合成数据集。

该数据集包含巽他语的高质量转录音频数据。数据集由波形文件和一个TSV文件组成，其中的文件line_index.tsv包含文件名和文件中音频的转录。每个文件名都以说话者识别号作为前缀。

数据集已经手动质量检查，但仍可能存在错误。

该数据集是由谷歌与印度尼西亚教育学院大学合作收集的。

该数据集在知识共享署名-相同方式共享 4.0 国际公共许可证下分发。有关许可信息，请参阅 LICENSE 文件和 https://github.com/google/language-resources#license 。

SLR52: 大规模僧伽罗语自动语音识别训练数据集。

该数据集包含僧伽罗语的转录音频数据（约185K个断句）。数据集由波形文件和一个TSV文件组成，其中的文件utt_spk_text.tsv包含文件的FileID、UserID以及文件中音频的转录。

数据集已经手动质量检查，但仍可能存在错误。

该数据集在知识共享署名-相同方式共享 4.0 国际公共许可证下分发。有关许可信息，请参阅 LICENSE 文件和 https://github.com/google/language-resources#license 。

SLR53: 大规模孟加拉语自动语音识别训练数据集。

该数据集包含孟加拉语的转录音频数据（约196K个断句）。数据集由波形文件和一个TSV文件组成，其中的文件utt_spk_text.tsv包含文件的FileID、UserID以及文件中音频的转录。

数据集已经手动质量检查，但仍可能存在错误。

该数据集在知识共享署名-相同方式共享 4.0 国际公共许可证下分发。有关许可信息，请参阅 LICENSE 文件和 https://github.com/google/language-resources#license 。

SLR54: 大规模尼泊尔语自动语音识别训练数据集。

该数据集包含尼泊尔语的转录音频数据（约157K个断句）。数据集由波形文件和一个TSV文件组成，其中的文件utt_spk_text.tsv包含文件的FileID、UserID以及文件中音频的转录。

数据集已经手动质量检查，但仍可能存在错误。

该数据集在知识共享署名-相同方式共享 4.0 国际公共许可证下分发。有关许可信息，请参阅 LICENSE 文件和 https://github.com/google/language-resources#license 。

SLR63: 众包马拉亚拉姆语高质量多说者语音数据集

该数据集包含由志愿者录制的马拉亚拉姆语句子的高质量转录音频数据。数据集由波形文件和一个TSV文件（line_index.tsv）组成，其中的文件line_index.tsv包含一个匿名化的FileID和文件中音频的转录。

数据集已经手动质量检查，但仍可能存在错误。

请在以下GitHub问题跟踪器中报告任何问题： https://github.com/googlei18n/language-resources/issues

该数据集在知识共享署名-相同方式共享 4.0 国际公共许可证下分发。有关许可信息，请参阅 LICENSE 文件和 https://github.com/google/language-resources#license 。

SLR64: 众包马拉地语高质量多说者语音数据集

该数据集包含由志愿者录制的马拉地语句子的高质量转录音频数据。数据集由波形文件和一个TSV文件（line_index.tsv）组成，其中的文件line_index.tsv包含一个匿名化的FileID和文件中音频的转录。

数据集已经手动质量检查，但仍可能存在错误。

请在以下GitHub问题跟踪器中报告任何问题： https://github.com/googlei18n/language-resources/issues

该数据集在知识共享署名-相同方式共享 4.0 国际公共许可证下分发。有关许可信息，请参阅 LICENSE 文件和 https://github.com/google/language-resources#license 。

SLR65: 众包泰米尔语高质量多说者语音数据集

该数据集包含由志愿者录制的泰米尔语句子的高质量转录音频数据。数据集由波形文件和一个TSV文件（line_index.tsv）组成，其中的文件line_index.tsv包含一个匿名化的FileID和文件中音频的转录。

数据集已经手动质量检查，但仍可能存在错误。

请在以下GitHub问题跟踪器中报告任何问题： https://github.com/googlei18n/language-resources/issues

该数据集在知识共享署名-相同方式共享 4.0 国际公共许可证下分发。有关许可信息，请参阅 LICENSE 文件和 https://github.com/google/language-resources#license 。

SLR66: 众包泰卢固语高质量多说者语音数据集

该数据集包含由志愿者录制的泰卢固语句子的高质量转录音频数据。数据集由波形文件和一个TSV文件（line_index.tsv）组成，其中的文件line_index.tsv包含一个匿名化的FileID和文件中音频的转录。

数据集已经手动质量检查，但仍可能存在错误。

请在以下GitHub问题跟踪器中报告任何问题： https://github.com/googlei18n/language-resources/issues

该数据集在知识共享署名-相同方式共享 4.0 国际公共许可证下分发。有关许可信息，请参阅 LICENSE 文件和 https://github.com/google/language-resources#license 。

SLR69: 众包加泰罗尼亚语高质量多说者语音数据集

该数据集包含由志愿者录制的加泰罗尼亚语句子的高质量转录音频数据。数据集由波形文件和一个TSV文件（line_index.tsv）组成，其中的文件line_index.tsv包含一个匿名化的FileID和文件中音频的转录。

数据集已经手动质量检查，但仍可能存在错误。

请在以下GitHub问题跟踪器中报告任何问题： https://github.com/googlei18n/language-resources/issues

该数据集在知识共享署名-相同方式共享 4.0 国际公共许可证下分发。有关许可信息，请参阅 LICENSE 文件和 https://github.com/google/language-resources#license 。

SLR70: 众包尼日利亚英语高质量多说者语音数据集

该数据集包含由志愿者录制的尼日利亚英语句子的高质量转录音频数据。数据集由波形文件和一个TSV文件（line_index.tsv）组成，其中的文件line_index.tsv包含一个匿名化的FileID和文件中音频的转录。

数据集已经手动质量检查，但仍可能存在错误。

请在以下GitHub问题跟踪器中报告任何问题： https://github.com/googlei18n/language-resources/issues

该数据集在知识共享署名-相同方式共享 4.0 国际公共许可证下分发。有关许可信息，请参阅 LICENSE 文件和 https://github.com/google/language-resources#license 。

SLR71: 众包智利西班牙语高质量多说者语音数据集

该数据集包含由志愿者录制的智利西班牙语句子的高质量转录音频数据。数据集由波形文件和一个TSV文件（line_index.tsv）组成，其中的文件line_index.tsv包含一个匿名化的FileID和文件中音频的转录。

数据集已经手动质量检查，但仍可能存在错误。

请在以下GitHub问题跟踪器中报告任何问题： https://github.com/googlei18n/language-resources/issues

该数据集在知识共享署名-相同方式共享 4.0 国际公共许可证下分发。有关许可信息，请参阅 LICENSE 文件和 https://github.com/google/language-resources#license 。

SLR72: 众包哥伦比亚西班牙语高质量多说者语音数据集

该数据集包含由志愿者录制的哥伦比亚西班牙语句子的高质量转录音频数据。数据集由波形文件和一个TSV文件（line_index.tsv）组成，其中的文件line_index.tsv包含一个匿名化的FileID和文件中音频的转录。

数据集已经手动质量检查，但仍可能存在错误。

请在以下GitHub问题跟踪器中报告任何问题： https://github.com/googlei18n/language-resources/issues

该数据集在知识共享署名-相同方式共享 4.0 国际公共许可证下分发。有关许可信息，请参阅 LICENSE 文件和 https://github.com/google/language-resources#license 。

SLR73: 众包秘鲁西班牙语高质量多说者语音数据集

该数据集包含由志愿者录制的秘鲁西班牙语句子的高质量转录音频数据。数据集由波形文件和一个TSV文件（line_index.tsv）组成，其中的文件line_index.tsv包含一个匿名化的FileID和文件中音频的转录。

数据集已经手动质量检查，但仍可能存在错误。

请在以下GitHub问题跟踪器中报告任何问题： https://github.com/googlei18n/language-resources/issues

该数据集在知识共享署名-相同方式共享 4.0 国际公共许可证下分发。有关许可信息，请参阅 LICENSE 文件和 https://github.com/google/language-resources#license 。

SLR74: 众包波多黎各西班牙语高质量多说者语音数据集

该数据集包含由志愿者录制的波多黎各西班牙语句子的高质量转录音频数据。数据集由波形文件和一个TSV文件（line_index.tsv）组成，其中的文件line_index.tsv包含一个匿名化的FileID和文件中音频的转录。

数据集已经手动质量检查，但仍可能存在错误。

请在以下GitHub问题跟踪器中报告任何问题： https://github.com/googlei18n/language-resources/issues

该数据集在知识共享署名-相同方式共享 4.0 国际公共许可证下分发。有关许可信息，请参阅 LICENSE 文件和 https://github.com/google/language-resources#license 。

SLR75: 众包委内瑞拉西班牙语高质量多说者语音数据集

该数据集包含由志愿者录制的委内瑞拉西班牙语句子的高质量转录音频数据。数据集由波形文件和一个TSV文件（line_index.tsv）组成，其中的文件line_index.tsv包含一个匿名化的FileID和文件中音频的转录。

数据集已经手动质量检查，但仍可能存在错误。

请在以下GitHub问题跟踪器中报告任何问题： https://github.com/googlei18n/language-resources/issues

该数据集在知识共享署名-相同方式共享 4.0 国际公共许可证下分发。有关许可信息，请参阅 LICENSE 文件和 https://github.com/google/language-resources#license 。

SLR76: 众包巴斯克语高质量多说者语音数据集

该数据集包含由志愿者录制的巴斯克语句子的高质量转录音频数据。数据集由波形文件和一个TSV文件（line_index.tsv）组成，其中的文件line_index.tsv包含一个匿名化的FileID和文件中音频的转录。

数据集已经手动质量检查，但仍可能存在错误。

请在以下GitHub问题跟踪器中报告任何问题： https://github.com/googlei18n/language-resources/issues

该数据集在知识共享署名-相同方式共享 4.0 国际公共许可证下分发。有关许可信息，请参阅 LICENSE 文件和 https://github.com/google/language-resources#license 。

SLR77: 众包加利西亚语高质量多说者语音数据集

该数据集包含由志愿者录制的加利西亚语句子的高质量转录音频数据。数据集由波形文件和一个TSV文件（line_index.tsv）组成，其中的文件line_index.tsv包含一个匿名化的FileID和文件中音频的转录。

数据集已经手动质量检查，但仍可能存在错误。

请在以下GitHub问题跟踪器中报告任何问题： https://github.com/googlei18n/language-resources/issues

该数据集在知识共享署名-相同方式共享 4.0 国际公共许可证下分发。有关许可信息，请参阅 LICENSE 文件和 https://github.com/google/language-resources#license 。

SLR78: 众包古吉拉特语高质量多说者语音数据集

该数据集包含由志愿者录制的古吉拉特语句子的高质量转录音频数据。数据集由波形文件和一个TSV文件（line_index.tsv）组成，其中的文件line_index.tsv包含一个匿名化的FileID和文件中音频的转录。

数据集已经手动质量检查，但仍可能存在错误。

请在以下GitHub问题跟踪器中报告任何问题： https://github.com/googlei18n/language-resources/issues

该数据集在知识共享署名-相同方式共享 4.0 国际公共许可证下分发。有关许可信息，请参阅 LICENSE 文件和 https://github.com/google/language-resources#license 。

SLR79: 众包卡纳达语高质量多说者语音数据集

该数据集包含由志愿者录制的卡纳达语句子的高质量转录音频数据。数据集由波形文件和一个TSV文件（line_index.tsv）组成，其中的文件line_index.tsv包含一个匿名化的FileID和文件中音频的转录。

数据集已经手动质量检查，但仍可能存在错误。

请在以下GitHub问题跟踪器中报告任何问题： https://github.com/googlei18n/language-resources/issues

该数据集在知识共享署名-相同方式共享 4.0 国际公共许可证下分发。有关许可信息，请参阅 LICENSE 文件和 https://github.com/google/language-resources#license 。

SLR80: 众包缅甸语高质量语音数据集

该数据集包含由志愿者录制的缅甸语句子的高质量转录音频数据。数据集由波形文件和一个TSV文件（line_index.tsv）组成，其中的文件line_index.tsv包含一个匿名化的FileID和文件中音频的转录。

数据集已经手动质量检查，但仍可能存在错误。

请在以下GitHub问题跟踪器中报告任何问题： https://github.com/googlei18n/language-resources/issues

该数据集在知识共享署名-相同方式共享 4.0 国际公共许可证下分发。有关许可信息，请参阅 LICENSE 文件和 https://github.com/google/language-resources#license 。

SLR83: 众包英式英语方言高质量语音数据集

该数据集包含由志愿者以不同语言方言录制的英语句子的高质量转录音频数据。数据集由波形文件和一个TSV文件（line_index.tsv）组成，其中的文件line_index.csv包含一个行ID、一个匿名化的FileID和文件中音频的转录。

数据集已经手动质量检查，但仍可能存在错误。

来自威尔士的英语演讲者的录音是与卡迪夫大学合作收集的。

该数据集在知识共享署名-相同方式共享 4.0 国际公共许可证下分发。有关许可信息，请参阅 LICENSE 文件和 https://github.com/google/language-resources#license 。

SLR86: 众包高质量多说者语音数据集

该数据集包含由志愿者录制的句子的高质量转录音频数据。数据集由波形文件和一个TSV文件（line_index.tsv）组成，其中的文件line_index.tsv包含一个匿名化的FileID和文件中音频的转录。

数据集已经手动质量检查，但仍可能存在错误。

请在以下GitHub问题跟踪器中报告任何问题： https://github.com/googlei18n/language-resources/issues

该数据集在知识共享署名-相同方式共享 4.0 国际公共许可证下分发。有关许可信息，请参阅 LICENSE 文件和 https://github.com/google/language-resources#license 。

支持的任务和排行榜

[需要更多信息]

语言

爪哇语、柬埔寨语、尼泊尔语、巽他语、马拉亚拉姆语、马拉地语、泰米尔语、泰卢固语、加泰罗尼亚语、尼日利亚英语、智利西班牙语、哥伦比亚西班牙语、秘鲁西班牙语、波多黎各西班牙语、委内瑞拉西班牙语、巴斯克语、加利西亚语、古吉拉特语、卡纳达语、南非荷兰语、塞索托语、塞茨瓦纳语和科萨语。

数据集结构

数据实例

一个典型的数据点包括音频文件的路径，称为path，并且包含该句子。

SLR32、SLR35、SLR36、SLR41、SLR42、SLR43、SLR44、SLR52、SLR53、SLR54、SLR63、SLR64、SLR65、SLR66、SLR69、SLR70、SLR71、SLR72、SLR73、SLR74、SLR75、SLR76、SLR77、SLR78、SLR79、SLR80、SLR86

{
  'path': '/home/cahya/.cache/huggingface/datasets/downloads/extracted/4d9cf915efc21110199074da4d492566dee6097068b07a680f670fcec9176e62/su_id_female/wavs/suf_00297_00037352660.wav'
  'audio': {'path': '/home/cahya/.cache/huggingface/datasets/downloads/extracted/4d9cf915efc21110199074da4d492566dee6097068b07a680f670fcec9176e62/su_id_female/wavs/suf_00297_00037352660.wav',
      'array': array([-0.00048828, -0.00018311, -0.00137329, ...,  0.00079346,
              0.00091553,  0.00085449], dtype=float32),
      'sampling_rate': 16000},
  'sentence': 'Panonton ting haruleng ningali Kelly Clarkson keur nyanyi di tipi',
}

数据字段

路径：音频文件的路径。
音频：包含下载的音频文件路径、解码的音频数组和采样率的字典。注意，访问音频列时：dataset[0]["音频"]，音频文件会自动解码并重采样为dataset.features["audio"].sampling_rate。解码和重采样大量音频文件可能需要很长时间。因此，在访问“音频”列之前，首先查询示例索引很重要，即dataset[0]["音频"]应始终优于dataset["音频"][0]。
句子：用户被要求说出的句子。

数据拆分

对于所有配置，只有一个“train”拆分，样本数量如下：

Number of examples
SLR41	5822
SLR42	2906
SLR43	2064
SLR44	4213
SLR63	4126
SLR64	1569
SLR65	4284
SLR66	4448
SLR69	4240
SLR35	185076
SLR36	219156
SLR70	3359
SLR71	4374
SLR72	4903
SLR73	5447
SLR74	617
SLR75	3357
SLR76	7136
SLR77	5587
SLR78	4272
SLR79	4400
SLR80	2530
SLR86	3583
SLR32	9821
SLR52	185293
SLR53	218703
SLR54	157905
SLR83	17877

数据集创建

策划原理

[需要更多信息]

源数据

初始数据采集和标准化

[需要更多信息]

谁是源语言制作者？

[需要更多信息]

注释

注释过程

[需要更多信息]

注释员是谁？

[需要更多信息]

个人和敏感信息

该数据集包含在线捐赠其声音的人。您同意不尝试确定数据集中的说话者身份。

使用数据的考虑事项

数据集的社会影响

[需要更多信息]

偏见讨论

[需要更多信息]

其他已知限制

[需要更多信息]

其他信息

数据集策划者

[需要更多信息]

许可信息

每个数据集都在知识共享署名-相同方式共享 4.0 国际公共许可证（ CC-BY-SA-4.0 ）下分发。有关详细信息，请参阅 https://github.com/google/language-resources#license 或 OpenSLR 上的资源页面。

引用信息

SLR32

@inproceedings{van-niekerk-etal-2017,
    title = {{Rapid development of TTS corpora for four South African languages}},
    author = {Daniel van Niekerk and Charl van Heerden and Marelie Davel and Neil Kleynhans and Oddur Kjartansson and Martin Jansche and Linne Ha},
    booktitle = {Proc. Interspeech 2017},
    pages = {2178--2182},
    address = {Stockholm, Sweden},
    month = aug,
    year  = {2017},
    URL   = {https://dx.doi.org/10.21437/Interspeech.2017-1139}
}

SLR35、SLR36、SLR52、SLR53、SLR54

@inproceedings{kjartansson-etal-sltu2018,
    title = {{Crowd-Sourced Speech Corpora for Javanese, Sundanese,  Sinhala, Nepali, and Bangladeshi Bengali}},
    author = {Oddur Kjartansson and Supheakmungkol Sarin and Knot Pipatsrisawat and Martin Jansche and Linne Ha},
    booktitle = {Proc. The 6th Intl. Workshop on Spoken Language Technologies for Under-Resourced Languages (SLTU)},
    year  = {2018},
    address = {Gurugram, India},
    month = aug,
    pages = {52--55},
    URL   = {https://dx.doi.org/10.21437/SLTU.2018-11},
}

SLR41、SLR42、SLR43、SLR44

@inproceedings{kjartansson-etal-tts-sltu2018,
    title = {{A Step-by-Step Process for Building TTS Voices Using Open Source Data and Framework for Bangla, Javanese, Khmer, Nepali, Sinhala, and Sundanese}},
    author = {Keshan Sodimana and Knot Pipatsrisawat and Linne Ha and Martin Jansche and Oddur Kjartansson and Pasindu De Silva and Supheakmungkol Sarin},
    booktitle = {Proc. The 6th Intl. Workshop on Spoken Language Technologies for Under-Resourced Languages (SLTU)},
    year  = {2018},
    address = {Gurugram, India},
    month = aug,
    pages = {66--70},
    URL   = {https://dx.doi.org/10.21437/SLTU.2018-14}
}

SLR63、SLR64、SLR65、SLR66、SLR78、SLR79

@inproceedings{he-etal-2020-open,
  title = {{Open-source Multi-speaker Speech Corpora for Building Gujarati, Kannada, Malayalam, Marathi, Tamil and Telugu Speech Synthesis Systems}},
  author = {He, Fei and Chu, Shan-Hui Cathy and Kjartansson, Oddur and Rivera, Clara and Katanova, Anna and Gutkin, Alexander and Demirsahin, Isin and Johny, Cibu and Jansche, Martin and Sarin, Supheakmungkol and Pipatsrisawat, Knot},
  booktitle = {Proceedings of The 12th Language Resources and Evaluation Conference (LREC)},
  month = may,
  year = {2020},
  address = {Marseille, France},
  publisher = {European Language Resources Association (ELRA)},
  pages = {6494--6503},
  url = {https://www.aclweb.org/anthology/2020.lrec-1.800},
  ISBN = "{979-10-95546-34-4},
}

SLR69、SLR76、SLR77

@inproceedings{kjartansson-etal-2020-open,
    title = {{Open-Source High Quality Speech Datasets for Basque, Catalan and Galician}},
    author = {Kjartansson, Oddur and Gutkin, Alexander and Butryna, Alena and Demirsahin, Isin and Rivera, Clara},
    booktitle = {Proceedings of the 1st Joint Workshop on Spoken Language Technologies for Under-resourced languages (SLTU) and Collaboration and Computing for Under-Resourced Languages (CCURL)},
    year = {2020},
    pages = {21--27},
    month = may,
    address = {Marseille, France},
    publisher = {European Language Resources association (ELRA)},
    url = {https://www.aclweb.org/anthology/2020.sltu-1.3},
    ISBN = {979-10-95546-35-1},
}

SLR70、SLR71、SLR72、SLR73、SLR74、SLR75

@inproceedings{guevara-rukoz-etal-2020-crowdsourcing,
    title = {{Crowdsourcing Latin American Spanish for Low-Resource Text-to-Speech}},
    author = {Guevara-Rukoz, Adriana and Demirsahin, Isin and He, Fei and Chu, Shan-Hui Cathy and Sarin, Supheakmungkol and Pipatsrisawat, Knot and Gutkin, Alexander and Butryna, Alena and Kjartansson, Oddur},
    booktitle = {Proceedings of The 12th Language Resources and Evaluation Conference (LREC)},
    year = {2020},
    month = may,
    address = {Marseille, France},
    publisher = {European Language Resources Association (ELRA)},
    url = {https://www.aclweb.org/anthology/2020.lrec-1.801},
    pages = {6504--6513},
    ISBN = {979-10-95546-34-4},
}

SLR80

@inproceedings{oo-etal-2020-burmese,
    title = {{Burmese Speech Corpus, Finite-State Text Normalization and Pronunciation Grammars with an Application to Text-to-Speech}},
    author = {Oo, Yin May and Wattanavekin, Theeraphol and Li, Chenfang and De Silva, Pasindu and Sarin, Supheakmungkol and Pipatsrisawat, Knot and Jansche, Martin and Kjartansson, Oddur and Gutkin, Alexander},
    booktitle = {Proceedings of The 12th Language Resources and Evaluation Conference (LREC)},
    month = may,
    year = {2020},
    pages = "6328--6339",
    address = {Marseille, France},
    publisher = {European Language Resources Association (ELRA)},
    url = {https://www.aclweb.org/anthology/2020.lrec-1.777},
    ISBN = {979-10-95546-34-4},
}

SLR86

@inproceedings{gutkin-et-al-yoruba2020,
    title = {{Developing an Open-Source Corpus of Yoruba Speech}},
    author = {Alexander Gutkin and I{\c{s}}{\i}n Demir{\c{s}}ahin and Oddur Kjartansson and Clara Rivera and K\d{\'o}lá Túb\d{\`o}sún},
    booktitle = {Proceedings of Interspeech 2020},
    pages = {404--408},
    month = {October},
    year = {2020},
    address = {Shanghai, China},
    publisher = {International Speech and Communication Association (ISCA)},
    doi = {10.21437/Interspeech.2020-1096},
    url = {https://dx.doi.org/10.21437/Interspeech.2020-1096},
}

贡献

感谢 @cahya-wirawan 提供此数据集。

作者:

佚名

数据集大小:

274.33 KB