Jupyter AI

25 DeepSeek接入Mureka,直接生成好听的音乐,确实可以封神了!

📅发表日期: 2025-03-26

🏷️分类: DeepSeek学习

👁️阅读次数: 0

DeepSeek在2个月前发布的R1模型因强大的推理能力,训练耗费GPU小时数更少,迅速在AI火爆出圈。前不久发布的智能体Manus,展现出了通用、高度全自动的特性,也惊艳了很多人。

上周一篇推文介绍了DeepSeek多模态大模型Janus-Pro:7B,后台有读者留言问我,想了解输入一段文字生成音乐,这方面的技术现在如何,有哪些好用的模型或工具,想把音乐接入他的自媒体创作里。

今天这篇文章来盘点一下,AI生成音乐这方面的技术进展,好用的大模型和工具,对此感兴趣的朋友可以看看。

1 AI生成音乐

为了写好今天这篇文章,调研了多个相关的主流模型,先给大家看一支今天疯传的AI音乐人MV

《Mureka》AI音乐人MV,歌手:Mureka;该作品由AI生成。其中音乐由Mureka生成,视频由SkyReels技术支持生成。

一共1分11秒,光听音质有人能听出来是真人创作还是AI生成么?我在发文之前邀请了3位朋友试听,他们很难相信歌曲完全是AI生成的,不知道学音乐专业的朋友能否区别出来,可以留言告诉我。

AI生成音乐随着大模型推理也迎来了快速发展,今天,昆仑万维发布全球首款音乐推理大模型Mureka O1,上面的音乐人MV正是他们官宣的首支作品,我未做任何修改。

我重点研究了Mureka O1模型相关介绍、使用技术,并进行了深度测试,接下来给大家逐一解答下它是怎么生成如此强大的音质的?

Mureka O1是昆仑万维研发的,我知道他们在2月开源了AI短剧大模型,并在hugging face上连续两周稳居TOP10,早在2023年底就有了解他们在研究AI生成音乐,Mureka升级到V6版本后,发布了O1模型。

2 技术难点

用 AI 生成一首好听 mp3 歌曲,难度远高于AI输出文字和图片,因为AI要像人写歌一样,有歌词、有旋律、有开头高潮结尾,还有乐器怎么配、什么时候变情绪等,把这些有机结合起来并不容易做到。

以前AI模型生成的歌虽然听起来像歌,但*没有结构逻辑,情绪线不清晰,乐器混乱。*

*我这两天看了Mureka O1相关的论文,也是重点解决了上面提到的AI生成音乐结构不够清晰、缺乏层次感的问题:*

Mureka O1 生成音乐

这篇论文引入了「Chain-of-Musical-Thought」方式,简称为MusiCoT,在真正生成音频前,先让模型“思考”整体结构。

如先来段钢琴,副歌要加大鼓声 ,用贝斯保持节奏,最后渐弱结束,这就像:先写好一份“编曲大纲”,再去一句一句填旋律细节,整体框架图如下所示:

Mureka O1 生成音乐

MusiCoT基于CLAP语音-文本对比预训练模型,无需人工标注即可扩展到多种音乐风格,并支持音乐参考输入,实现高保真、可解释的 AI音乐生成。

MusiCoT解决了AI音乐缺乏结构与乐器编排混乱的关键问题,首次让AI在生成前“先想清楚整首歌怎么写”,大大提升了音乐的连贯性、逻辑性和可控性。

文生音乐还有另一个大模型Suno,尤其擅长英文歌曲创作,我试过它生成中文歌曲,但没有Mureka O1好听,背后原因就是O1这种MusiCoT框架使得它能,更容易支持跨语言,更容易支持多种音乐风格。除此以外,它和支持指定歌手音色,经过调研发现只有它家支持定制上传歌手音色的功能。

3 测评Mureka O1

我比较感兴趣指定歌手音色,然后生成差不多的音色旋律的歌曲。测评它的基本思路,找喜欢的歌手其中一首歌,然后叫Mureka O1生成和旋律差不多的歌曲。下面总结下基本步骤,感兴趣的可以根据下面步骤,生成自己喜欢歌手的相似歌曲。

第一步,打开浏览器并输入:https://mureka.ai

点击左侧的create按钮,再点击Song,如下所示:

Mureka O1 生成音乐

第二步,点击页面中间的Reference + 按钮:

Mureka O1 生成音乐

在弹出来的页面中,点击Upload audio按钮,然后加载自己喜欢歌手的一首歌曲:

Mureka O1 生成音乐

比如我加下了许巍的《那一年》,加载后还支持剪辑,不过我没有修改:

Mureka O1 生成音乐

第三步,写入下面提示词到下面面板中:

Mureka O1 生成音乐

一首温柔抒情的摇滚歌曲,由男声演唱,采用木吉他和电吉他结合的编曲,情感真挚,旋律悠扬。歌词表达对青春岁月的回忆和成长中的感悟:

最后点击create按钮,很快就会生成两手歌曲,如下所示:

Mureka O1 生成音乐

生成的mp3我也上传上来,大家可以听一听效果,比较像真人所唱,并且旋律和《那一年》挺相似:

一首温柔抒情的摇滚歌曲由男声演唱采用木吉他和电吉他结合的编曲,郭震AI,2分钟

这些生成效果背后,主要还是MusiCoT在起作用,首次在音乐生成中引入“思维链”机制,先生成可分析的音乐结构,再生成音频内容,从而大幅提升了音乐的连贯性、编排精度与可控性。

之前写一首歌,得有专业编曲创作,歌手专业录音棚录制,没有个几天时间出不来一首歌,现在有了AI,如下所示创作出高质量的和真人一样歌曲只Mureka O1大概1分多钟:

Mureka O1 生成音乐

总结一下

现在,像 Mureka O1 这样的音乐大模型,仅需一段文字描述,甚至还能上传你喜欢的歌手音色或旋律参考,就在1分钟左右生成结构清晰、情绪丰富、旋律动听的完整歌曲。

这背后关键技术是 MusiCoT ——一种“音乐思维链”机制,它让 AI 像真正的音乐人那样,先想清楚整首歌怎么写,再去细化每一段旋律与乐器编排,因此生成的音乐更自然、更像人写的。

如果你是自媒体创作者、短视频博主、音乐爱好者,或者单纯想给生活多点灵感,现在正是入门AI音乐的好时机。

最后补充一点,他家还支持API,开发者、音乐人、以及游戏开发者都可以将Mureka的音乐生成能力无缝集成到自己的产品或平台中。

以上全文2989字,10图。如果觉得这篇文章对你有用,可否点个关注。给我个三连击:点赞、转发和在看。若可以再给我加个⭐️,谢谢你看我的文章,我们下篇再见。

💬 评论

暂无评论

🐳DeepSeek本地部署 (滚动鼠标查看)