3 步开始你的 AI 音乐创作
输入描述、上传素材,或两者一起用
你可以直接输入一段描述,上传一张图片、一个视频片段,或一段音频素材。也可以把它们组合起来使用,例如一边描述想要的氛围,一边附上一张参考图片。Music Agent 会根据你提供的任意输入开始创作。
AI 理解输入并开始作曲
AI 会读取你的文本、画面内容、音频特征,或多种信息组合,从中识别情绪、能量感、风格线索和节奏,再使用你选定的 Suno 模型完成作曲。开始之前,你可以先在选择器里切换合适的模型档位。
开始生成并下载作品
点击 “开始” 后,就可以试听生成结果、下载歌曲,或基于不同输入继续开启新一轮创作。系统会自动保存你的生成历史,方便你随时回看和继续迭代。
一个输入入口,打开更多音乐可能
你可以从任何已有素材开始创作。一段文字描述、一张相册里的照片、一段剪辑时间线中的视频片段,或者一条语音备忘录,都能成为起点。你不需要先学会专业音乐术语,也不需要写结构化提示词。只要给 Music Agent 一点可用信息,它就能继续往下完成创作。

任意素材,都能生成一首歌
上传一张照片,AI 会读取其中的视觉氛围并生成匹配音乐;上传一段视频,它会根据节奏和画面情绪自动配乐;输入一段音频片段(32 秒到 8 分钟),系统还能围绕它创作全新作品。支持最大 50MB 图片、100MB 视频,兼容 JPG、PNG、WEBP、MP4、MOV、MPEG、MP3、M4A 等格式。Music Agent 基本都能处理。

为什么创作者会选择 AI Music Agent
这也是为什么 AI Music Agent 会成为从任意素材出发进行音乐创作时,最灵活的一种方式。
文本、图片、视频、音频都能用
文本、图片、视频和音频都可以作为输入。你可以上传一张落日照片生成氛围音乐,上传一段视频自动生成配乐,也可以直接从音频参考出发。很少有 AI 音乐工具能同时支持这四类输入。
对话式界面,几乎零门槛
没有复杂表单,没有一堆固定字段。你可以自然输入、直接上传文件,然后点击 Start Cooking。即使不懂音乐术语,也能更轻松地开始创作。
内置 4 档 AI 音乐模式
平台内置与 AI 音乐生成器相同的 4 档 AI 音乐质量模式。你可以根据项目需要在创意表现、人声质量、生成速度和稳定输出之间自由切换。
卡住时也有灵感提示
当你面对空白输入框没有灵感时,界面底部会持续轮换创意建议,帮助你快速开始。你既可以直接套用,也可以把它们当作灵感起点。
完整保存每次创作历史
每次会话都会被保存。你可以随时回到之前的生成结果,修改输入后重新生成,不必每次都从零开始。
打通完整 SunoPrompt 生态
Music Agent 与 SunoPrompt 其他工具天然联动。你可以接入提示词生成器中的 Prompt,把成品继续交给人声分离工具处理,整条创作链路都能在一个平台内完成。
整套工具里最灵活的创作入口
Music Agent 与完整 SunoPrompt 工具箱打通
Music Agent 是 SunoPrompt 生态中最灵活的一环。它可以连接提示词生成器中的输入、AI 音乐生成器中的成品,以及人声分离工具中的拆轨流程。
AI Music Agent
这是一款对话式、多模态 AI 音乐创作工具。你可以输入文本、上传图片、视频或音频,并获得一首完整生成的音乐作品。内置 4 档 AI 音乐质量模式,可随时切换。
AI 音乐生成器
如果你更偏好结构化操作,也可以使用 AI 音乐生成器。它提供描述、标题、曲风、声线性别、纯音乐开关等表单式控制,并支持文本生成音乐和歌词生成音乐两种模式。
提示词生成器与人声分离工具
你还可以先用提示词生成器构建更详细的 Prompt,再交给 Music Agent 或 AI 音乐生成器;或者把最终成品交给人声分离工具继续拆分 stems。所有工具都可以联动使用。

探索更多工具
谁在使用 AI Music Agent
适合音乐人和制作人
上传一段自己哼唱旋律的语音备忘录,让 Music Agent 围绕它扩展成完整编曲。一个 30 秒的灵感片段,也能快速变成接近成品的作品,无需先打开 DAW。
你还可以上传参考歌曲,再通过文字说明你想改变什么。AI 会以音频为风格参考,创作出一首方向相近但内容原创的新作品。
同一个输入可以在 4 档 AI 质量模式之间自由切换,让你更直观地比较不同模型如何理解相同素材。高阶模式更敢于做创意尝试,推荐模式更重视人声表现,标准模式则更稳。
什么是 AI Music Agent?
AI Music Agent 是一款对话式音乐创作工具,可以把文本描述、图片、视频和音频片段转成原创音乐。上传任意素材,或直接描述一种感觉,AI 就会为你生成匹配的歌曲或配乐。
它更像创作伙伴,而不是一个表单工具
AI Music Agent 是一种对话式 AI 音乐创作工具,可以把任意输入转成音乐。和传统表单式生成器不同,它以聊天式界面工作。你可以像和创意搭档交流一样,自然地描述想法、上传参考素材,或同时做这两件事。AI 会理解你的意图,并据此生成匹配的音乐作品。
文本、图片、视频、音频都能作为起点
这也是 Music Agent 最独特的地方。你可以上传一张落日照片,生成温暖的氛围音乐;也可以上传一段街头竞速视频,生成高能电子配乐;还可以丢进一段语音备忘录,让 AI 围绕它扩展成完整编曲。文本、图片、视频和音频都能作为创作输入,这种多模态能力是大多数 AI 音乐工具不具备的。
没灵感时,也能给你创作启发
Music Agent 不只是执行指令,它还能在你没有灵感时主动提供起点。界面底部会轮换展示提示词建议,例如“Cult Aesthetic Supreme”“Hypnotic ASMR Soundscapes”“一首关于失去爱情的乡村流行抒情歌”等。你可以直接使用,也可以把它们当作灵感延伸。
多模态创作,是 AI 音乐的下一步
随着 AI 音乐模型持续进化,从任意素材开始创作的能力会越来越强。现在你已经可以上传一张图生成一首歌;接下来,AI 音乐创作会越来越像连续工作流,例如先描述概念,再生成歌曲,再通过后续指令持续调整并导出成品。Music Agent 正是这种创作方式的前沿形态。
Music Agent 有什么不同
Music Agent 是 SunoPrompt 生态里唯一同时支持图片、视频、音频与文本输入的工具。多数 AI 音乐产品仍然只能处理文本,而 Music Agent 可以从照片中读取视觉情绪、从视频中提取节奏与氛围、从音频素材中参考风格方向。这种多模态能力,打开了纯文本提示词无法覆盖的创作路径。
对话式界面也改变了你和 AI 音乐工具的互动方式。你不需要再填写一堆表单或不断切换下拉选项,而是像和协作对象沟通一样,直接描述需求、上传素材,然后点击 Start Cooking。界面底部还会在你卡住时提供灵感建议,历史记录会保存每次创作过程,4 档 AI 音乐模式也可一键切换。整个体验更像是在和一个真正理解你想法的创作伙伴协作。