摩尔线程推出开源音频理解大模型MooER

登录注册

资讯

学习

基础知识理论实践学习教程

企业招聘

下载

模型数据集

AI工具箱

企业服务

EVA 智能HR 视频AI

ChatGPT 人工智能应用人工智能未来计算机视觉

热门新闻

行业人工智能

为什么数据污染对LLM来说是一个大问题

机器人康奈尔大学

康奈尔大学推出新的社交机器人，更柔软，更人性化

行业人工智能

所以，能动手就别吵吵了

常用工具

火山写作

字节跳动旗下团队推出的免费AI英语写作助手

Stable Diffusion

StabilityAI推出的文本到图像生成AI

GitHub Copilot

GitHub AI编程工具

Adobe Firefly

Adobe最新推出的AI图片生成工具

文心一格

AI艺术和创意辅助平台

您尚未登录账户

请先登录您的atyun账户，方可使用该功能

仅限企业账户使用

该功能仅限企业账号使用，开通企业账号可享受更多服务，是否现在注册企业账号？

立即注册企业账号

暂不需要

您的企业账号申请正在审核中

审核通过后即可使用此功能，请耐心等待~

2024年08月26日由 daydream 发表 268 0

近日，摩尔线程正式发布了其自主研发的音频理解大模型MooER，这是国内首个基于国产全功能GPU训练的开源项目。MooER不仅具备中文和英文的语音识别能力，还实现了中译英的语音翻译功能，标志着国内AI语音技术迈出了重要一步。

微信截图_20240826105658

MooER在Covost2中译英测试集上的表现尤为亮眼，取得了25.2的BLEU分数，这一成绩已接近工业级应用水平。为了促进AI语音技术的进一步发展，摩尔线程AI团队已公开了MooER的推理代码及5000小时的训练模型，并计划在未来开放更多训练代码及8万小时的训练数据。

从技术层面来看，MooER采用了深度学习架构，特别是通过端到端的训练方式，直接从原始语音信号生成文本输出，省去了传统语音识别系统中复杂的模块划分。其内部结构设计包括Encoder、Adapter和Decoder（基于大型语言模型LLM）三个部分，分别负责特征提取、模型适应性和文本生成。此外，MooER还引入了LoRA（Low-Rank Adaptation）技术，通过优化模型中的少量参数，提高了训练效率和效果。

值得注意的是，MooER在训练过程中还采用了伪标签技术，即利用模型自身的预测结果作为训练数据，进一步增强了模型的学习能力。同时，该模型支持中文和英文的语音识别及中译英的语音翻译，展现了其强大的多语言处理能力。

摩尔线程的这一举措，无疑为国内AI语音技术的发展注入了新的活力。随着更多训练数据和代码的开放，MooER有望成为推动AI语音技术进步的重要力量。

文章来源：https://www.atyun.com/60261.html

标签：

大模型音频摩尔线程

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇 NVIDIA发布Mistral-NeMo-Minitron 8B：新一代高效大型语言模型

下一篇 Meta实验室推出的AI视觉模型Sapiens，专注于人类动作理解

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

AGENTIC AI如何塑造未来