AI Music Agent

3 步开始你的 AI 音乐创作

输入描述、上传素材，或两者一起用
你可以直接输入一段描述，上传一张图片、一个视频片段，或一段音频素材。也可以把它们组合起来使用，例如一边描述想要的氛围，一边附上一张参考图片。Music Agent 会根据你提供的任意输入开始创作。
AI 理解输入并开始作曲
AI 会读取你的文本、画面内容、音频特征，或多种信息组合，从中识别情绪、能量感、风格线索和节奏，再使用你选定的 Suno 模型完成作曲。开始之前，你可以先在选择器里切换合适的模型档位。
开始生成并下载作品
点击 “开始” 后，就可以试听生成结果、下载歌曲，或基于不同输入继续开启新一轮创作。系统会自动保存你的生成历史，方便你随时回看和继续迭代。

多模态创作工具

一个输入入口，打开更多音乐可能

你可以从任何已有素材开始创作。一段文字描述、一张相册里的照片、一段剪辑时间线中的视频片段，或者一条语音备忘录，都能成为起点。你不需要先学会专业音乐术语，也不需要写结构化提示词。只要给 Music Agent 一点可用信息，它就能继续往下完成创作。

支持图片、视频与音频输入

任意素材，都能生成一首歌

上传一张照片，AI 会读取其中的视觉氛围并生成匹配音乐；上传一段视频，它会根据节奏和画面情绪自动配乐；输入一段音频片段（32 秒到 8 分钟），系统还能围绕它创作全新作品。支持最大 50MB 图片、100MB 视频，兼容 JPG、PNG、WEBP、MP4、MOV、MPEG、MP3、M4A 等格式。Music Agent 基本都能处理。

为什么创作者会选择 AI Music Agent

这也是为什么 AI Music Agent 会成为从任意素材出发进行音乐创作时，最灵活的一种方式。

文本、图片、视频、音频都能用

文本、图片、视频和音频都可以作为输入。你可以上传一张落日照片生成氛围音乐，上传一段视频自动生成配乐，也可以直接从音频参考出发。很少有 AI 音乐工具能同时支持这四类输入。

对话式界面，几乎零门槛

没有复杂表单，没有一堆固定字段。你可以自然输入、直接上传文件，然后点击 Start Cooking。即使不懂音乐术语，也能更轻松地开始创作。

内置 4 档 AI 音乐模式

平台内置与 AI 音乐生成器相同的 4 档 AI 音乐质量模式。你可以根据项目需要在创意表现、人声质量、生成速度和稳定输出之间自由切换。

卡住时也有灵感提示

当你面对空白输入框没有灵感时，界面底部会持续轮换创意建议，帮助你快速开始。你既可以直接套用，也可以把它们当作灵感起点。

完整保存每次创作历史

每次会话都会被保存。你可以随时回到之前的生成结果，修改输入后重新生成，不必每次都从零开始。

打通完整 SunoPrompt 生态

Music Agent 与 SunoPrompt 其他工具天然联动。你可以接入提示词生成器中的 Prompt，把成品继续交给人声分离工具处理，整条创作链路都能在一个平台内完成。

整套工具里最灵活的创作入口

Music Agent 与完整 SunoPrompt 工具箱打通

Music Agent 是 SunoPrompt 生态中最灵活的一环。它可以连接提示词生成器中的输入、AI 音乐生成器中的成品，以及人声分离工具中的拆轨流程。

这是一款对话式、多模态 AI 音乐创作工具。你可以输入文本、上传图片、视频或音频，并获得一首完整生成的音乐作品。内置 4 档 AI 音乐质量模式，可随时切换。

AI 音乐生成器

如果你更偏好结构化操作，也可以使用 AI 音乐生成器。它提供描述、标题、曲风、声线性别、纯音乐开关等表单式控制，并支持文本生成音乐和歌词生成音乐两种模式。

提示词生成器与人声分离工具

你还可以先用提示词生成器构建更详细的 Prompt，再交给 Music Agent 或 AI 音乐生成器；或者把最终成品交给人声分离工具继续拆分 stems。所有工具都可以联动使用。

探索更多工具

谁在使用 AI Music Agent

适合音乐人和制作人

上传一段自己哼唱旋律的语音备忘录，让 Music Agent 围绕它扩展成完整编曲。一个 30 秒的灵感片段，也能快速变成接近成品的作品，无需先打开 DAW。

你还可以上传参考歌曲，再通过文字说明你想改变什么。AI 会以音频为风格参考，创作出一首方向相近但内容原创的新作品。

同一个输入可以在 4 档 AI 质量模式之间自由切换，让你更直观地比较不同模型如何理解相同素材。高阶模式更敢于做创意尝试，推荐模式更重视人声表现，标准模式则更稳。

什么是 AI Music Agent？

AI Music Agent 是一款对话式音乐创作工具，可以把文本描述、图片、视频和音频片段转成原创音乐。上传任意素材，或直接描述一种感觉，AI 就会为你生成匹配的歌曲或配乐。

它更像创作伙伴，而不是一个表单工具

AI Music Agent 是一种对话式 AI 音乐创作工具，可以把任意输入转成音乐。和传统表单式生成器不同，它以聊天式界面工作。你可以像和创意搭档交流一样，自然地描述想法、上传参考素材，或同时做这两件事。AI 会理解你的意图，并据此生成匹配的音乐作品。

文本、图片、视频、音频都能作为起点

这也是 Music Agent 最独特的地方。你可以上传一张落日照片，生成温暖的氛围音乐；也可以上传一段街头竞速视频，生成高能电子配乐；还可以丢进一段语音备忘录，让 AI 围绕它扩展成完整编曲。文本、图片、视频和音频都能作为创作输入，这种多模态能力是大多数 AI 音乐工具不具备的。

没灵感时，也能给你创作启发

Music Agent 不只是执行指令，它还能在你没有灵感时主动提供起点。界面底部会轮换展示提示词建议，例如“Cult Aesthetic Supreme”“Hypnotic ASMR Soundscapes”“一首关于失去爱情的乡村流行抒情歌”等。你可以直接使用，也可以把它们当作灵感延伸。

多模态创作，是 AI 音乐的下一步

随着 AI 音乐模型持续进化，从任意素材开始创作的能力会越来越强。现在你已经可以上传一张图生成一首歌；接下来，AI 音乐创作会越来越像连续工作流，例如先描述概念，再生成歌曲，再通过后续指令持续调整并导出成品。Music Agent 正是这种创作方式的前沿形态。

Music Agent 有什么不同

Music Agent 是 SunoPrompt 生态里唯一同时支持图片、视频、音频与文本输入的工具。多数 AI 音乐产品仍然只能处理文本，而 Music Agent 可以从照片中读取视觉情绪、从视频中提取节奏与氛围、从音频素材中参考风格方向。这种多模态能力，打开了纯文本提示词无法覆盖的创作路径。

对话式界面也改变了你和 AI 音乐工具的互动方式。你不需要再填写一堆表单或不断切换下拉选项，而是像和协作对象沟通一样，直接描述需求、上传素材，然后点击 Start Cooking。界面底部还会在你卡住时提供灵感建议，历史记录会保存每次创作过程，4 档 AI 音乐模式也可一键切换。整个体验更像是在和一个真正理解你想法的创作伙伴协作。