昆仑万维的音乐魔盒,又进阶了(昆仑万维音乐模型详解)

昆仑万维的音乐魔盒,又进阶了(昆仑万维音乐模型详解)

撰文丨潘己鹤

有“音乐圈DeepSeek”称号的Mureka,又有大动作。

7月23日,昆仑万维宣布,旗下AI音乐生成平台Mureka,基座模型再次迭代,全新音乐模型Mureka V7正式上线。

Mureka的新版本,将AI音乐的效果,猛拉一个台阶,单曲时长延伸到5.5分钟,且可以输出更具吸引力的旋律与编曲。

昆仑万维官方出品的《杜甫》歌曲

“不论人声、混声还是作曲旋律,都基本超越Suno,尤其人声拟真度,新版本有大幅提升。”有创作者忍不住感叹。

昆仑万维埋头修炼产品力和技术力,打造AI视频SkyReels、AI社交Linky、AI Agent Skywork等在内的多元应用矩阵,提速商业化。

AI音乐领域,Mureka V6 3月底发布后,新增注册用户近300万,充分证明其市场号召力。

这一“AI大杀器”再次更新,昆仑万维毫不掩饰其在AI音乐赛道的野心:

它要改写游戏规则,给那些被主流体系忽略的、表达欲望无法释放的普通人,插上自由创作的翅膀。

Mureka V7 + TTS V1双模型上线,AI音乐进入个性化时代

实测Mureka V7,创作者最大的感受是,Mureka干活细致,生成的内容自然流畅,质量稳定。

这背后是V7升级技术,让音乐品质产生质变——增强音乐人声与乐器真实度,大幅改善旋律动机与编曲质量,令用户制作出质感细腻的个人独家BGM。

先放一段官方Demo,大家体验下。

官方对Mureka V7的介绍,耐人寻味,称之为“一座24小时不打烊的私人录音棚”。多项技术,支撑听感提升。

先看关键的良品率,从V6的43.4%到V7的57.7%,输入提示词后,获得好听歌曲的概率大幅提升。

人声真实度和表达力,提升44%,这让AI音乐不再生硬,有了“呼吸感”;整体音质提升近一倍。

相较V6的单曲最长4.5分钟,V7延长到5.5分钟,同样是2积分/每2首歌,可谓加量不加价。

和之前版本一样的是,Mureka V7划分为简单、高级两种模式。

简单模式下,用户输入大白话描述自己对歌曲的需求,在对话框里填写文字,适配各种场景的音乐作品,一键入耳。

高级模式下,输入关键词,让AI生成歌词后,可精准选择风格,对歌曲进行细致调整。

比如,在输入框输入“夏天,蝉鸣,毕业季”三个关键词,一两秒时间,Mureka自动生成几段歌词:

夏日蝉鸣毕业季/每一声都藏着秘密/树荫下笑语轻起/青春回忆在风里飘逸……

简单的字句,递进押韵,铺开离别情绪,旋律层次丰富,且自动划分主歌、副歌等段落。

用户若对歌词不满意,可标记进行优化,还能续写,生成歌词窗口的最大容量,能够达到3000字符。

接下来,点击“创作”,一首2分20秒的音乐作品,立等可听。

Mureka还有个独特的音乐参考功能。

用户可上传参考歌曲,提供相似曲风、自定义歌手、描述想要的音乐风格以及自行哼唱旋律,Mureka会识别音乐类型、节奏、配器和情绪等要素,由此确保作品风格的一致性。

这可以衍生出更多玩法,比如用邓丽君的温柔嗓音,演绎周杰伦风格的歌曲。

总而言之,Mureka竭尽全力帮用户洞察需求,捕捉那微妙而难以言明的表达要点,精准戳中爽感。

Mureka还有很多亮点。比如,支持纯音乐生成,支持10种语言的AI音乐创作,用户还可以自定义歌手音色,甚至上传自己的声音。

自研MusiCoT思维链颠覆音乐创作,中国技术领跑新赛道

怎么干好“AI音乐生成”这件事,昆仑万维想得很早、很深,走出迥然不同的一条技术路线。

过去主流AI音乐模型,采用自回归(Autoregressive, AR)模型路线,其基于逐token预测的范式,连贯性与情感建构带有拼接感。

直白点说,就是能听,但“差点意思”。

Mureka的特点是,其采用自研的MusiCoT技术,可显著提升模型生成结果的整体性与发声表现。

其专为音乐生成而设计的链式思维(Chain-of-Thought, CoT)提示方法,打通了高保真AI音乐的技术堵点,音乐模型生成质量更高,推动打破“AI音乐没有灵魂”这一刻板印象。

2025年3月,公司正式推出 Mureka O1 模型及 Mureka V6 模型。作为全球首个音乐推理大模型的 Mureka O1,其性能全面超越 Suno,成功登顶 SOTA。

此次升级,在V6的基础上,V7进一步优化MusiCoT技术。

它重要的一个创新,是“先结构,后生成”的做法。在正式生成音频token之前,引导模型生成一份全局音乐结构规划,明确整体的段落、情绪、编配等布局。

打个比方,新手绘画时,常常缺乏规划,想到哪画到哪,成品会缺乏整体性,一些AI音乐生成模型,也有“顾局部不顾全局”的毛病。

MusiCoT先打“草稿”后创作,类似人类创作逻辑,AI不只是即兴演奏者,还是思考严谨的作曲家,其生成的作品,乐章推进与情绪递进非常自然。

基于CLAP模型,MusiCoT还有“音乐思维链”,具备明确的语义指向。

音乐创作的整体结构,可分析、可控制,允许输入任意长度的参考音频作为风格提示,由此,提升模型在复刻、变奏等创作需求中的灵活性,规避直接复制的风险。

昆仑万维称,基于大量实验,主观与客观双重指标下,MusiCoT技术均展现领先效果,在多项评测中的表现,达到行业一流水准。

新版本中,在结构层面,MusiCoT的思考逻辑,更像人类作曲家,还通过Mureka团队数据的scale-up以及Embedding信息粒度的细化,完善可控性与可扩展性,努力化解文本和音频之间,模态差异的那道鸿沟。

怎么把AI音乐玩出新花样,Mureka团队下了番功夫。此次推出的Mureka TTS V1,支持Voice Design能力,用户可使用文本控制音色生成。

不论真实人物、虚拟人物还是配音角色,通通能用文字调度,“菜色”更丰富,不似过去只能在特定音色库里挑选。

从技术指标来看,Mureka单是语音质量,就达到4.6分,超过Elevenlabs(4.36),整体听感远超同行。

以MusiCoT为核心的一系列技术创新,拉动Mureka“人人可用、好用、易用”,具有开创性意义,推动AI音乐快速走向工业化。

音乐终究服务于人的耳朵。如果AI音乐生成,停留在模板化、套路化阶段,劣质内容就无法打动听众,更别说产生情感共鸣。

只有AI音乐工具更好用,生成的音乐品质更高,“AI造富人类”才不会沦为一句空话。

昆仑万维AI矩阵厚积薄发,加速跑通商业化

本质上,Mureka的定位,仍是工具,未介入到渠道层面。

这意味着,昆仑万维对所有音乐平台敞开大门,持开放态度,用户亦然——无论来自什么领域,只要爱好音乐或有创作需求,Mureka都提供一揽子工具包,人人触手可及。

Mureka支持10种语言作曲

它承载着“文化平权”“AI平权”的命题,亦寄托着昆仑万维“让每个人更好地塑造和表达自我”的重大使命。

纵观人类历史,文化创作一直是高阶层的特权。

尤其在音乐创作领域,复杂的乐理知识、昂贵的作曲设备、专业的制作软件,让创作音乐成为小部分人的闭门派对。

以编曲来说,有音乐基础的人,也需要付出很多时间成本和资金投入。这种生产环节,非常适合用AI来简化和提效。

Mureka V7的意义,正在于此——AI音乐平台不是“玩具”,而是一款可“创作”的专业级产品。

普通人的灵感火花和表达欲望,需要一个出口释放;手头不宽裕、愿意拥抱变化的音乐人,AI能成为他们的阶梯。

不久的将来,我们将看到,AI音乐进入权威音乐排行榜,成为金曲。

届时,创作壁垒瓦解,音乐产业迎接“个体化时代”,文化话语权实现再分配,点燃新的大众文艺火花。

改变,已在悄然发生。比如,有博主靠一首2分多钟的AI音乐,变现超5万元,在网易云音乐上的日播放量,最高达到15万。

昆仑万维推动AI与人文艺术融合,使文化产业发展走向去中心化。反过来讲,音乐创作这个30多亿美元的市场,只要公司能吃下2%,规模已非常可观。

从数据来看,Mureka推出的3月,月访问量高达333万,一举成为全球AI音乐品类增速最高。截至3月底,AI音乐年化流水收入ARR达到约1200万美金。

爆发的市场、亮眼的收入,都在证明赛道热度和公司战略前瞻性。

沿着“All in AGI与AIGC”的战略方向,昆仑万维坚定前进。

作为中国领先的人工智能科技公司,近年来昆仑万维在AI大模型、AI搜索、AI短剧、AI音乐、AI游戏、AI社交等多个领域取得了显著进展,构建了全面的AI业务布局。2024年度财报显示,昆仑万维实现营业总收入56.6亿元,同比增长15.2%,整体毛利率达73.6%。

大模型技术,正加速从“技术验证”向“商业闭环”跨越,在迈向全球AI巨头的道路上,昆仑万维悄然加速。

特别声明:[昆仑万维的音乐魔盒,又进阶了(昆仑万维音乐模型详解)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

潘阳嫁10亿富豪,婚后常带儿子住娘家,夫妻关系真相揭秘(潘阳嫁10亿富豪长居娘家)

这或许是因为她希望能过上与父亲无关的平凡生活,但谁又能想象,在她的家中,潘长江的照片几乎遍布每一个角落。尽管潘长江并不希望女儿进入娱乐圈,认为这个行业充满了不确定性和浮躁,但潘阳依然坚定地选择了这条道路,甚至…

潘阳嫁10亿富豪,婚后常带儿子住娘家,夫妻关系真相揭秘(潘阳嫁10亿富豪长居娘家)

水箱高低液位检测使用哪种液位传感器(水箱高低液位传感器)

在实际应用中,通常需要使用液位传感器来监控水位变化,特别是在家庭、工业以及农业领域中,液位传感器的选择至关重要。 为了实现高低水位的精准监测,通常会在水箱的不同位置分别安装两个光电液位传感器,一个位于水箱底部…

水箱高低液位检测使用哪种液位传感器(水箱高低液位传感器)

防火卷帘ce认证(防火卷帘型式检验报告)

CE认证是产品进入欧洲市场的必备条件之一,对于防火卷帘而言,通过CE认证不仅意味着符合欧盟的安全标准,还能提升产品的市场竞争力。 通过测试和审核后,认证机构会颁发CE证书,允许产品加贴CE标志并进入欧盟市场。…

防火卷帘ce认证(防火卷帘型式检验报告)

路都走不稳,全程开原音假唱,还想去鸟巢开演唱会,谁给的自信?(路都走不稳还开演唱会)

在这第一波解释没有能平息争议之后,那艺娜的团队就又开始在粉丝群里面想要把这件事甩锅给观众了。 但是这些伪装都掩盖不了那一那只是一个草根网红的事实,她没有任何演技,也没有任何实力,能够火起来,也纯是网友们在起…

路都走不稳,全程开原音假唱,还想去鸟巢开演唱会,谁给的自信?(路都走不稳还开演唱会)

近视度数有“红线”,超过600度危险!严重可致失明,防控要趁早

近视是一种常见的屈光不正问题,但当度数不断加深超过一定范围时,可能会引发一系列眼部病变,甚至导致失明。医学上将近视分为轻度(300度以下)、中度(300-600度)和高度(600度以上)。其中,高度近视的危害远超视力模糊,需要引起高度重视

近视度数有“红线”,超过600度危险!严重可致失明,防控要趁早