数据集:
openslr
任务:
自动语音识别计算机处理:
multilingual大小:
1K<n<10K语言创建人:
found批注创建人:
found源数据集:
original许可:
cc-by-sa-4.0OpenSLR 是一个致力于托管语音和语言资源(如语音识别的训练语料库)和与语音识别相关的软件的网站。目前,可用的资源如下:
SLR32: 南非四种语言(af、st、tn、xh)的高质量语音合成数据。该数据集包含南非四种语言的多说者高质量的转录音频数据。数据集由波形文件和一个TSV文件组成,其中每个文件夹的文件line_index.tsv包含一个FileID,该FileID包含用户ID和文件中音频的转录。
数据集已经进行了一些质量检查,但仍可能存在错误。
该数据集是由南非西北大学(North West University)和谷歌(Google)合作收集的。
该数据集在知识共享署名-相同方式共享 4.0 国际公共许可证下分发。有关许可信息,请参阅 https://github.com/google/language-resources#license 。
版权所有 2017 Google, Inc.
SLR35: 大规模爪哇语自动语音识别训练数据集。该数据集包含篇章爪哇语的转录音频数据(约185K个断句)。数据集由波形文件和一个TSV文件组成,其中的文件utt_spk_text.tsv包含文件的FileID、UserID以及文件中音频的转录。
数据集已经手动质量检查,但仍可能存在错误。
该数据集是由谷歌与冰岛大学(Reykjavik University)和印度尼西亚加德满都大学(Universitas Gadjah Mada)合作收集的。
该数据集在知识共享署名-相同方式共享 4.0 国际公共许可证下分发。有关许可信息,请参阅 LICENSE 文件和 https://github.com/google/language-resources#license 。
版权所有 2016, 2017 Google, Inc.
SLR36: 大规模巽他语自动语音识别训练数据集。该数据集包含巽他语的转录音频数据(约220K个断句)。数据集由波形文件和一个TSV文件组成,其中的文件utt_spk_text.tsv包含文件的FileID、UserID以及文件中音频的转录。
数据集已经手动质量检查,但仍可能存在错误。
该数据集是由谷歌在印度尼西亚收集的。
该数据集在知识共享署名-相同方式共享 4.0 国际公共许可证下分发。有关许可信息,请参阅 LICENSE 文件和 https://github.com/google/language-resources#license 。
版权所有 2016, 2017 Google, Inc.
SLR41: 爪哇语高质量语音合成数据集。该数据集包含爪哇语的高质量转录音频数据。数据集由波形文件和一个TSV文件组成,其中的文件line_index.tsv包含文件名和文件中音频的转录。每个文件名都以说话者识别号作为前缀。
数据集已经手动质量检查,但仍可能存在错误。
该数据集是由谷歌与印度尼西亚加德满都大学合作收集的。
该数据集在知识共享署名-相同方式共享 4.0 国际公共许可证下分发。有关许可信息,请参阅 LICENSE 文件和 https://github.com/google/language-resources#license 。
版权所有 2016, 2017, 2018 Google LLC
SLR42: 柬埔寨语高质量语音合成数据集。该数据集包含柬埔寨语的高质量转录音频数据。数据集由波形文件和一个TSV文件组成,其中的文件line_index.tsv包含文件名和文件中音频的转录。每个文件名都以说话者识别号作为前缀。
数据集已经手动质量检查,但仍可能存在错误。
该数据集是由谷歌收集的。
该数据集在知识共享署名-相同方式共享 4.0 国际公共许可证下分发。有关许可信息,请参阅 LICENSE 文件和 https://github.com/google/language-resources#license 。
版权所有 2016, 2017, 2018 Google LLC
SLR43: 尼泊尔语高质量语音合成数据集。该数据集包含尼泊尔语的高质量转录音频数据。数据集由波形文件和一个TSV文件组成,其中的文件line_index.tsv包含文件名和文件中音频的转录。每个文件名都以说话者识别号作为前缀。
数据集已经手动质量检查,但仍可能存在错误。
该数据集是由谷歌在尼泊尔收集的。
该数据集在知识共享署名-相同方式共享 4.0 国际公共许可证下分发。有关许可信息,请参阅 LICENSE 文件和 https://github.com/google/language-resources#license 。
版权所有 2016, 2017, 2018 Google LLC
SLR44: 巽他语高质量语音合成数据集。该数据集包含巽他语的高质量转录音频数据。数据集由波形文件和一个TSV文件组成,其中的文件line_index.tsv包含文件名和文件中音频的转录。每个文件名都以说话者识别号作为前缀。
数据集已经手动质量检查,但仍可能存在错误。
该数据集是由谷歌与印度尼西亚教育学院大学合作收集的。
该数据集在知识共享署名-相同方式共享 4.0 国际公共许可证下分发。有关许可信息,请参阅 LICENSE 文件和 https://github.com/google/language-resources#license 。
版权所有 2016, 2017, 2018 Google LLC
SLR52: 大规模僧伽罗语自动语音识别训练数据集。该数据集包含僧伽罗语的转录音频数据(约185K个断句)。数据集由波形文件和一个TSV文件组成,其中的文件utt_spk_text.tsv包含文件的FileID、UserID以及文件中音频的转录。
数据集已经手动质量检查,但仍可能存在错误。
该数据集在知识共享署名-相同方式共享 4.0 国际公共许可证下分发。有关许可信息,请参阅 LICENSE 文件和 https://github.com/google/language-resources#license 。
版权所有 2016, 2017, 2018 Google, Inc.
SLR53: 大规模孟加拉语自动语音识别训练数据集。该数据集包含孟加拉语的转录音频数据(约196K个断句)。数据集由波形文件和一个TSV文件组成,其中的文件utt_spk_text.tsv包含文件的FileID、UserID以及文件中音频的转录。
数据集已经手动质量检查,但仍可能存在错误。
该数据集在知识共享署名-相同方式共享 4.0 国际公共许可证下分发。有关许可信息,请参阅 LICENSE 文件和 https://github.com/google/language-resources#license 。
版权所有 2016, 2017, 2018 Google, Inc.
SLR54: 大规模尼泊尔语自动语音识别训练数据集。该数据集包含尼泊尔语的转录音频数据(约157K个断句)。数据集由波形文件和一个TSV文件组成,其中的文件utt_spk_text.tsv包含文件的FileID、UserID以及文件中音频的转录。
数据集已经手动质量检查,但仍可能存在错误。
该数据集在知识共享署名-相同方式共享 4.0 国际公共许可证下分发。有关许可信息,请参阅 LICENSE 文件和 https://github.com/google/language-resources#license 。
版权所有 2016, 2017, 2018 Google, Inc.
SLR63: 众包马拉亚拉姆语高质量多说者语音数据集该数据集包含由志愿者录制的马拉亚拉姆语句子的高质量转录音频数据。数据集由波形文件和一个TSV文件(line_index.tsv)组成,其中的文件line_index.tsv包含一个匿名化的FileID和文件中音频的转录。
数据集已经手动质量检查,但仍可能存在错误。
请在以下GitHub问题跟踪器中报告任何问题: https://github.com/googlei18n/language-resources/issues
该数据集在知识共享署名-相同方式共享 4.0 国际公共许可证下分发。有关许可信息,请参阅 LICENSE 文件和 https://github.com/google/language-resources#license 。
版权所有 2018, 2019 Google, Inc.
SLR64: 众包马拉地语高质量多说者语音数据集该数据集包含由志愿者录制的马拉地语句子的高质量转录音频数据。数据集由波形文件和一个TSV文件(line_index.tsv)组成,其中的文件line_index.tsv包含一个匿名化的FileID和文件中音频的转录。
数据集已经手动质量检查,但仍可能存在错误。
请在以下GitHub问题跟踪器中报告任何问题: https://github.com/googlei18n/language-resources/issues
该数据集在知识共享署名-相同方式共享 4.0 国际公共许可证下分发。有关许可信息,请参阅 LICENSE 文件和 https://github.com/google/language-resources#license 。
版权所有 2018, 2019 Google, Inc.
SLR65: 众包泰米尔语高质量多说者语音数据集该数据集包含由志愿者录制的泰米尔语句子的高质量转录音频数据。数据集由波形文件和一个TSV文件(line_index.tsv)组成,其中的文件line_index.tsv包含一个匿名化的FileID和文件中音频的转录。
数据集已经手动质量检查,但仍可能存在错误。
请在以下GitHub问题跟踪器中报告任何问题: https://github.com/googlei18n/language-resources/issues
该数据集在知识共享署名-相同方式共享 4.0 国际公共许可证下分发。有关许可信息,请参阅 LICENSE 文件和 https://github.com/google/language-resources#license 。
版权所有 2018, 2019 Google, Inc.
SLR66: 众包泰卢固语高质量多说者语音数据集该数据集包含由志愿者录制的泰卢固语句子的高质量转录音频数据。数据集由波形文件和一个TSV文件(line_index.tsv)组成,其中的文件line_index.tsv包含一个匿名化的FileID和文件中音频的转录。
数据集已经手动质量检查,但仍可能存在错误。
请在以下GitHub问题跟踪器中报告任何问题: https://github.com/googlei18n/language-resources/issues
该数据集在知识共享署名-相同方式共享 4.0 国际公共许可证下分发。有关许可信息,请参阅 LICENSE 文件和 https://github.com/google/language-resources#license 。
版权所有 2018, 2019 Google, Inc.
SLR69: 众包加泰罗尼亚语高质量多说者语音数据集该数据集包含由志愿者录制的加泰罗尼亚语句子的高质量转录音频数据。数据集由波形文件和一个TSV文件(line_index.tsv)组成,其中的文件line_index.tsv包含一个匿名化的FileID和文件中音频的转录。
数据集已经手动质量检查,但仍可能存在错误。
请在以下GitHub问题跟踪器中报告任何问题: https://github.com/googlei18n/language-resources/issues
该数据集在知识共享署名-相同方式共享 4.0 国际公共许可证下分发。有关许可信息,请参阅 LICENSE 文件和 https://github.com/google/language-resources#license 。
版权所有 2018, 2019 Google, Inc.
SLR70: 众包尼日利亚英语高质量多说者语音数据集该数据集包含由志愿者录制的尼日利亚英语句子的高质量转录音频数据。数据集由波形文件和一个TSV文件(line_index.tsv)组成,其中的文件line_index.tsv包含一个匿名化的FileID和文件中音频的转录。
数据集已经手动质量检查,但仍可能存在错误。
请在以下GitHub问题跟踪器中报告任何问题: https://github.com/googlei18n/language-resources/issues
该数据集在知识共享署名-相同方式共享 4.0 国际公共许可证下分发。有关许可信息,请参阅 LICENSE 文件和 https://github.com/google/language-resources#license 。
版权所有 2018, 2019 Google, Inc.
SLR71: 众包智利西班牙语高质量多说者语音数据集该数据集包含由志愿者录制的智利西班牙语句子的高质量转录音频数据。数据集由波形文件和一个TSV文件(line_index.tsv)组成,其中的文件line_index.tsv包含一个匿名化的FileID和文件中音频的转录。
数据集已经手动质量检查,但仍可能存在错误。
请在以下GitHub问题跟踪器中报告任何问题: https://github.com/googlei18n/language-resources/issues
该数据集在知识共享署名-相同方式共享 4.0 国际公共许可证下分发。有关许可信息,请参阅 LICENSE 文件和 https://github.com/google/language-resources#license 。
版权所有 2018, 2019 Google, Inc.
SLR72: 众包哥伦比亚西班牙语高质量多说者语音数据集该数据集包含由志愿者录制的哥伦比亚西班牙语句子的高质量转录音频数据。数据集由波形文件和一个TSV文件(line_index.tsv)组成,其中的文件line_index.tsv包含一个匿名化的FileID和文件中音频的转录。
数据集已经手动质量检查,但仍可能存在错误。
请在以下GitHub问题跟踪器中报告任何问题: https://github.com/googlei18n/language-resources/issues
该数据集在知识共享署名-相同方式共享 4.0 国际公共许可证下分发。有关许可信息,请参阅 LICENSE 文件和 https://github.com/google/language-resources#license 。
版权所有 2018, 2019 Google, Inc.
SLR73: 众包秘鲁西班牙语高质量多说者语音数据集该数据集包含由志愿者录制的秘鲁西班牙语句子的高质量转录音频数据。数据集由波形文件和一个TSV文件(line_index.tsv)组成,其中的文件line_index.tsv包含一个匿名化的FileID和文件中音频的转录。
数据集已经手动质量检查,但仍可能存在错误。
请在以下GitHub问题跟踪器中报告任何问题: https://github.com/googlei18n/language-resources/issues
该数据集在知识共享署名-相同方式共享 4.0 国际公共许可证下分发。有关许可信息,请参阅 LICENSE 文件和 https://github.com/google/language-resources#license 。
版权所有 2018, 2019 Google, Inc.
SLR74: 众包波多黎各西班牙语高质量多说者语音数据集该数据集包含由志愿者录制的波多黎各西班牙语句子的高质量转录音频数据。数据集由波形文件和一个TSV文件(line_index.tsv)组成,其中的文件line_index.tsv包含一个匿名化的FileID和文件中音频的转录。
数据集已经手动质量检查,但仍可能存在错误。
请在以下GitHub问题跟踪器中报告任何问题: https://github.com/googlei18n/language-resources/issues
该数据集在知识共享署名-相同方式共享 4.0 国际公共许可证下分发。有关许可信息,请参阅 LICENSE 文件和 https://github.com/google/language-resources#license 。
版权所有 2018, 2019 Google, Inc.
SLR75: 众包委内瑞拉西班牙语高质量多说者语音数据集该数据集包含由志愿者录制的委内瑞拉西班牙语句子的高质量转录音频数据。数据集由波形文件和一个TSV文件(line_index.tsv)组成,其中的文件line_index.tsv包含一个匿名化的FileID和文件中音频的转录。
数据集已经手动质量检查,但仍可能存在错误。
请在以下GitHub问题跟踪器中报告任何问题: https://github.com/googlei18n/language-resources/issues
该数据集在知识共享署名-相同方式共享 4.0 国际公共许可证下分发。有关许可信息,请参阅 LICENSE 文件和 https://github.com/google/language-resources#license 。
版权所有 2018, 2019 Google, Inc.
SLR76: 众包巴斯克语高质量多说者语音数据集该数据集包含由志愿者录制的巴斯克语句子的高质量转录音频数据。数据集由波形文件和一个TSV文件(line_index.tsv)组成,其中的文件line_index.tsv包含一个匿名化的FileID和文件中音频的转录。
数据集已经手动质量检查,但仍可能存在错误。
请在以下GitHub问题跟踪器中报告任何问题: https://github.com/googlei18n/language-resources/issues
该数据集在知识共享署名-相同方式共享 4.0 国际公共许可证下分发。有关许可信息,请参阅 LICENSE 文件和 https://github.com/google/language-resources#license 。
版权所有 2018, 2019 Google, Inc.
SLR77: 众包加利西亚语高质量多说者语音数据集该数据集包含由志愿者录制的加利西亚语句子的高质量转录音频数据。数据集由波形文件和一个TSV文件(line_index.tsv)组成,其中的文件line_index.tsv包含一个匿名化的FileID和文件中音频的转录。
数据集已经手动质量检查,但仍可能存在错误。
请在以下GitHub问题跟踪器中报告任何问题: https://github.com/googlei18n/language-resources/issues
该数据集在知识共享署名-相同方式共享 4.0 国际公共许可证下分发。有关许可信息,请参阅 LICENSE 文件和 https://github.com/google/language-resources#license 。
版权所有 2018, 2019 Google, Inc.
SLR78: 众包古吉拉特语高质量多说者语音数据集该数据集包含由志愿者录制的古吉拉特语句子的高质量转录音频数据。数据集由波形文件和一个TSV文件(line_index.tsv)组成,其中的文件line_index.tsv包含一个匿名化的FileID和文件中音频的转录。
数据集已经手动质量检查,但仍可能存在错误。
请在以下GitHub问题跟踪器中报告任何问题: https://github.com/googlei18n/language-resources/issues
该数据集在知识共享署名-相同方式共享 4.0 国际公共许可证下分发。有关许可信息,请参阅 LICENSE 文件和 https://github.com/google/language-resources#license 。
版权所有 2018, 2019 Google, Inc.
SLR79: 众包卡纳达语高质量多说者语音数据集该数据集包含由志愿者录制的卡纳达语句子的高质量转录音频数据。数据集由波形文件和一个TSV文件(line_index.tsv)组成,其中的文件line_index.tsv包含一个匿名化的FileID和文件中音频的转录。
数据集已经手动质量检查,但仍可能存在错误。
请在以下GitHub问题跟踪器中报告任何问题: https://github.com/googlei18n/language-resources/issues
该数据集在知识共享署名-相同方式共享 4.0 国际公共许可证下分发。有关许可信息,请参阅 LICENSE 文件和 https://github.com/google/language-resources#license 。
版权所有 2018, 2019 Google, Inc.
SLR80: 众包缅甸语高质量语音数据集该数据集包含由志愿者录制的缅甸语句子的高质量转录音频数据。数据集由波形文件和一个TSV文件(line_index.tsv)组成,其中的文件line_index.tsv包含一个匿名化的FileID和文件中音频的转录。
数据集已经手动质量检查,但仍可能存在错误。
请在以下GitHub问题跟踪器中报告任何问题: https://github.com/googlei18n/language-resources/issues
该数据集在知识共享署名-相同方式共享 4.0 国际公共许可证下分发。有关许可信息,请参阅 LICENSE 文件和 https://github.com/google/language-resources#license 。
版权所有 2018, 2019 Google, Inc.
SLR83: 众包英式英语方言高质量语音数据集该数据集包含由志愿者以不同语言方言录制的英语句子的高质量转录音频数据。数据集由波形文件和一个TSV文件(line_index.tsv)组成,其中的文件line_index.csv包含一个行ID、一个匿名化的FileID和文件中音频的转录。
数据集已经手动质量检查,但仍可能存在错误。
来自威尔士的英语演讲者的录音是与卡迪夫大学合作收集的。
该数据集在知识共享署名-相同方式共享 4.0 国际公共许可证下分发。有关许可信息,请参阅 LICENSE 文件和 https://github.com/google/language-resources#license 。
版权所有 2018, 2019 Google, Inc.
SLR86: 众包高质量多说者语音数据集该数据集包含由志愿者录制的句子的高质量转录音频数据。数据集由波形文件和一个TSV文件(line_index.tsv)组成,其中的文件line_index.tsv包含一个匿名化的FileID和文件中音频的转录。
数据集已经手动质量检查,但仍可能存在错误。
请在以下GitHub问题跟踪器中报告任何问题: https://github.com/googlei18n/language-resources/issues
该数据集在知识共享署名-相同方式共享 4.0 国际公共许可证下分发。有关许可信息,请参阅 LICENSE 文件和 https://github.com/google/language-resources#license 。
版权所有 2018, 2019, 2020 Google, Inc.
[需要更多信息]
爪哇语、柬埔寨语、尼泊尔语、巽他语、马拉亚拉姆语、马拉地语、泰米尔语、泰卢固语、加泰罗尼亚语、尼日利亚英语、智利西班牙语、哥伦比亚西班牙语、秘鲁西班牙语、波多黎各西班牙语、委内瑞拉西班牙语、巴斯克语、加利西亚语、古吉拉特语、卡纳达语、南非荷兰语、塞索托语、塞茨瓦纳语和科萨语。
一个典型的数据点包括音频文件的路径,称为path,并且包含该句子。
SLR32、SLR35、SLR36、SLR41、SLR42、SLR43、SLR44、SLR52、SLR53、SLR54、SLR63、SLR64、SLR65、SLR66、SLR69、SLR70、SLR71、SLR72、SLR73、SLR74、SLR75、SLR76、SLR77、SLR78、SLR79、SLR80、SLR86{ 'path': '/home/cahya/.cache/huggingface/datasets/downloads/extracted/4d9cf915efc21110199074da4d492566dee6097068b07a680f670fcec9176e62/su_id_female/wavs/suf_00297_00037352660.wav' 'audio': {'path': '/home/cahya/.cache/huggingface/datasets/downloads/extracted/4d9cf915efc21110199074da4d492566dee6097068b07a680f670fcec9176e62/su_id_female/wavs/suf_00297_00037352660.wav', 'array': array([-0.00048828, -0.00018311, -0.00137329, ..., 0.00079346, 0.00091553, 0.00085449], dtype=float32), 'sampling_rate': 16000}, 'sentence': 'Panonton ting haruleng ningali Kelly Clarkson keur nyanyi di tipi', }
对于所有配置,只有一个“train”拆分,样本数量如下:
Number of examples | |
---|---|
SLR41 | 5822 |
SLR42 | 2906 |
SLR43 | 2064 |
SLR44 | 4213 |
SLR63 | 4126 |
SLR64 | 1569 |
SLR65 | 4284 |
SLR66 | 4448 |
SLR69 | 4240 |
SLR35 | 185076 |
SLR36 | 219156 |
SLR70 | 3359 |
SLR71 | 4374 |
SLR72 | 4903 |
SLR73 | 5447 |
SLR74 | 617 |
SLR75 | 3357 |
SLR76 | 7136 |
SLR77 | 5587 |
SLR78 | 4272 |
SLR79 | 4400 |
SLR80 | 2530 |
SLR86 | 3583 |
SLR32 | 9821 |
SLR52 | 185293 |
SLR53 | 218703 |
SLR54 | 157905 |
SLR83 | 17877 |
[需要更多信息]
[需要更多信息]
谁是源语言制作者?[需要更多信息]
[需要更多信息]
注释员是谁?[需要更多信息]
该数据集包含在线捐赠其声音的人。您同意不尝试确定数据集中的说话者身份。
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
每个数据集都在知识共享署名-相同方式共享 4.0 国际公共许可证( CC-BY-SA-4.0 )下分发。有关详细信息,请参阅 https://github.com/google/language-resources#license 或 OpenSLR 上的资源页面。
@inproceedings{van-niekerk-etal-2017, title = {{Rapid development of TTS corpora for four South African languages}}, author = {Daniel van Niekerk and Charl van Heerden and Marelie Davel and Neil Kleynhans and Oddur Kjartansson and Martin Jansche and Linne Ha}, booktitle = {Proc. Interspeech 2017}, pages = {2178--2182}, address = {Stockholm, Sweden}, month = aug, year = {2017}, URL = {https://dx.doi.org/10.21437/Interspeech.2017-1139} }SLR35、SLR36、SLR52、SLR53、SLR54
@inproceedings{kjartansson-etal-sltu2018, title = {{Crowd-Sourced Speech Corpora for Javanese, Sundanese, Sinhala, Nepali, and Bangladeshi Bengali}}, author = {Oddur Kjartansson and Supheakmungkol Sarin and Knot Pipatsrisawat and Martin Jansche and Linne Ha}, booktitle = {Proc. The 6th Intl. Workshop on Spoken Language Technologies for Under-Resourced Languages (SLTU)}, year = {2018}, address = {Gurugram, India}, month = aug, pages = {52--55}, URL = {https://dx.doi.org/10.21437/SLTU.2018-11}, }SLR41、SLR42、SLR43、SLR44
@inproceedings{kjartansson-etal-tts-sltu2018, title = {{A Step-by-Step Process for Building TTS Voices Using Open Source Data and Framework for Bangla, Javanese, Khmer, Nepali, Sinhala, and Sundanese}}, author = {Keshan Sodimana and Knot Pipatsrisawat and Linne Ha and Martin Jansche and Oddur Kjartansson and Pasindu De Silva and Supheakmungkol Sarin}, booktitle = {Proc. The 6th Intl. Workshop on Spoken Language Technologies for Under-Resourced Languages (SLTU)}, year = {2018}, address = {Gurugram, India}, month = aug, pages = {66--70}, URL = {https://dx.doi.org/10.21437/SLTU.2018-14} }SLR63、SLR64、SLR65、SLR66、SLR78、SLR79
@inproceedings{he-etal-2020-open, title = {{Open-source Multi-speaker Speech Corpora for Building Gujarati, Kannada, Malayalam, Marathi, Tamil and Telugu Speech Synthesis Systems}}, author = {He, Fei and Chu, Shan-Hui Cathy and Kjartansson, Oddur and Rivera, Clara and Katanova, Anna and Gutkin, Alexander and Demirsahin, Isin and Johny, Cibu and Jansche, Martin and Sarin, Supheakmungkol and Pipatsrisawat, Knot}, booktitle = {Proceedings of The 12th Language Resources and Evaluation Conference (LREC)}, month = may, year = {2020}, address = {Marseille, France}, publisher = {European Language Resources Association (ELRA)}, pages = {6494--6503}, url = {https://www.aclweb.org/anthology/2020.lrec-1.800}, ISBN = "{979-10-95546-34-4}, }SLR69、SLR76、SLR77
@inproceedings{kjartansson-etal-2020-open, title = {{Open-Source High Quality Speech Datasets for Basque, Catalan and Galician}}, author = {Kjartansson, Oddur and Gutkin, Alexander and Butryna, Alena and Demirsahin, Isin and Rivera, Clara}, booktitle = {Proceedings of the 1st Joint Workshop on Spoken Language Technologies for Under-resourced languages (SLTU) and Collaboration and Computing for Under-Resourced Languages (CCURL)}, year = {2020}, pages = {21--27}, month = may, address = {Marseille, France}, publisher = {European Language Resources association (ELRA)}, url = {https://www.aclweb.org/anthology/2020.sltu-1.3}, ISBN = {979-10-95546-35-1}, }SLR70、SLR71、SLR72、SLR73、SLR74、SLR75
@inproceedings{guevara-rukoz-etal-2020-crowdsourcing, title = {{Crowdsourcing Latin American Spanish for Low-Resource Text-to-Speech}}, author = {Guevara-Rukoz, Adriana and Demirsahin, Isin and He, Fei and Chu, Shan-Hui Cathy and Sarin, Supheakmungkol and Pipatsrisawat, Knot and Gutkin, Alexander and Butryna, Alena and Kjartansson, Oddur}, booktitle = {Proceedings of The 12th Language Resources and Evaluation Conference (LREC)}, year = {2020}, month = may, address = {Marseille, France}, publisher = {European Language Resources Association (ELRA)}, url = {https://www.aclweb.org/anthology/2020.lrec-1.801}, pages = {6504--6513}, ISBN = {979-10-95546-34-4}, }SLR80
@inproceedings{oo-etal-2020-burmese, title = {{Burmese Speech Corpus, Finite-State Text Normalization and Pronunciation Grammars with an Application to Text-to-Speech}}, author = {Oo, Yin May and Wattanavekin, Theeraphol and Li, Chenfang and De Silva, Pasindu and Sarin, Supheakmungkol and Pipatsrisawat, Knot and Jansche, Martin and Kjartansson, Oddur and Gutkin, Alexander}, booktitle = {Proceedings of The 12th Language Resources and Evaluation Conference (LREC)}, month = may, year = {2020}, pages = "6328--6339", address = {Marseille, France}, publisher = {European Language Resources Association (ELRA)}, url = {https://www.aclweb.org/anthology/2020.lrec-1.777}, ISBN = {979-10-95546-34-4}, }SLR86
@inproceedings{gutkin-et-al-yoruba2020, title = {{Developing an Open-Source Corpus of Yoruba Speech}}, author = {Alexander Gutkin and I{\c{s}}{\i}n Demir{\c{s}}ahin and Oddur Kjartansson and Clara Rivera and K\d{\'o}lá Túb\d{\`o}sún}, booktitle = {Proceedings of Interspeech 2020}, pages = {404--408}, month = {October}, year = {2020}, address = {Shanghai, China}, publisher = {International Speech and Communication Association (ISCA)}, doi = {10.21437/Interspeech.2020-1096}, url = {https://dx.doi.org/10.21437/Interspeech.2020-1096}, }
感谢 @cahya-wirawan 提供此数据集。