模型:

reazon-research/reazonspeech-espnet-v1

英文

reazonspeech-espnet-v1

reazonspeech-espnet-v1是用于日语自动语音识别(ASR)的ESPnet模型。

  • 该模型在ReazonSpeech语料库的15,000小时训练而成。
  • 在使用该模型时,请确保您的音频文件采样率为16khz。

有关更多详细信息,请访问 the official project page.