模型:

wannaphong/khanomtan-tts-v1.0

英文

KhanomTan TTS v1.0

KhanomTan TTS(ขนมตาล)是一个开源的泰文文本到语音模型,支持包括泰文、英文等多种语言的发音。

KhanomTan TTS是一个YourTTS模型,通过使用来自 the ? Coqui-TTS 的代码以及使用泰语语音语料库TSync 1*和TSync 2*对多语言进行训练。

配置

我们使用泰语字符的graphemes配置来训练模型,并使用来自 ? Coqui-TTS 的说话人编码模型。

数据集

我们使用的数据集是不完整的Tsync 1和Tsync 2语料库,并将它们添加到 mbarnig/lb-de-fr-en-pt-12800-TTS-CORPUS 数据集中。

模型训练

我们使用? Coqui-TTS多语言VITS模型配方(版本0.7.1或提交ID为d46fbc240ccf21797d42ac26cb27eb0b9f8d31c4)进行模型训练,并使用来自 ? Coqui-TTS 的说话人编码器模型,然后将最佳模型发布给公众访问。

*注意:这些不是完整的语料库。我们只能访问公共语料库。