昆仑万维发布全球首款音乐推理大模型Mureka O1

2025年03月27日 由 daydream 发表 2107 0

3月26日,昆仑万维正式推出两款全新音乐生成模型:Mureka V6和Mureka O1。其中,Mureka O1被定义为全球首个引入思维链(Chain-of-Thought, CoT)技术的音乐推理大模型,标志着AI音乐生成领域的一次重要进展。


微信截图_20250327092418


Mureka V6作为基础模型,支持纯音乐生成以及十种语言的歌词创作,包括英语、中文、日语、韩语、法语等。其自研的ICL(in-context learning)技术显著提升了声场表现、人声质感和混音设计效果。用户可以通过简单的文本输入生成多风格音乐,涵盖爵士、电子、流行、摇滚等多种曲风,并支持多样化的情感表达。


Mureka O1则基于V6模型进行了优化,首次将CoT技术应用于音乐生成领域。该技术通过预生成整体音乐结构,提高了音频生成的连贯性和乐器编排的精准度。相比于传统的逐步生成方式,O1在歌词与旋律的契合度、演唱准确性和艺术表现力等方面均有显著提升。据公开数据,在多项客观指标测试中,Mureka O1的表现优于Suno V4,尤其在混音、人声质感和背景音乐质量方面表现突出。


此外,Mureka平台提供了两个特色功能:歌曲参考和音色克隆。歌曲参考允许用户上传音频或链接作为提示,直接生成相似风格的音乐;音色克隆则支持用户选择官方提供的歌手音色或上传自己的声音,生成高度拟真的个性化作品。这一功能降低了专业音乐制作的技术门槛,使普通用户也能轻松参与音乐创作。


在开发者生态方面,Mureka开放了API服务和模型微调功能。其API支持音乐生成和语音合成两大类应用,适用于内容创作、游戏配乐、短视频制作等场景。同时,用户可通过上传私有数据对模型进行微调,定制专属音乐风格。数据隐私方面,平台承诺严格保护用户上传的数据,确保其仅用于个人模型训练。


Mureka的研发团队公开了O1模型的核心技术原理——MusiCoT算法框架,旨在推动行业共同进步。MusiCoT基于CLAP模型,无需人工标注即可扩展,大幅提升了生成音乐的可解释性和质量。这一技术创新被认为是高保真AI音乐生成的重要突破。

文章来源:https://mp.weixin.qq.com/s/1JPYXUwX-1JAVpz3IgygtQ
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消