什么是音乐音高?AI 音乐创作完整指南
在音频世界中,音乐音高(Music Pitch)是声音的"垂直"维度——即一个音符听起来有多"高"或多"低"。如果说节奏推动音乐向前发展,那么音高则赋予了音乐旋律、和声及音调特征。
从物理学角度看,音高是频率(Frequency)——一个连续的、无限的振动频谱。然而,在音乐理论和 AI 生成中,我们将这些无限的频率组织成特定的、可管理的类别。
对于使用像 Suno 这样生成式 AI 工具的创作者来说,理解音高至关重要。它能让你超越通用的提示词,精确控制音轨的音区(Register,高音 vs. 低音)、确定性(Definiteness,旋律 vs. 噪音)以及调律(Tuning)。
什么是音乐音高?
音乐音高是声音频率的感知表现。
- 高音(High Pitch): 由快速振动产生(例如:哨声、小提琴)。
- 低音(Low Pitch): 由慢速振动产生(例如:雷声、低沉的嗓音、贝斯吉他)。
在 AI 音乐创作的语境中,我们通常不会输入具体的频率数值(如"440Hz"),而是使用描述词来引导 AI 生成特定音域和音质的声音。
AI 提示词:音高分类与提示词完整指南
为了有效控制 AI 中的音高,我们需要从两个层面来理解:基础理论维度(帮助你理解声音的构成)和实战 AI 提示词(直接用于生成音乐的指令)。
重要提示: 在使用 Suno 等 AI 音乐工具时,我们强烈建议您直接使用下表中对应的"英文 AI 提示词"。由于这些 AI 模型主要基于英语数据训练,使用英文术语能让 AI 更准确地识别您的意图,从而生成更符合预期的音乐效果。
第一部分:音高的理论维度(理解基础)
这些维度描述了我们如何将无限的声音频率进行分类。
维度 1:基于音高集合(Pitch Classes)
一个八度(Octave)内声音最基本的划分方式。
| 中文术语 | 英文术语 | 描述 / 数量 |
|---|---|---|
| 音名 / 音级 | Pitch Class | 一个八度内的基础音符名称。西方音乐中有 12 种。 |
| 自然音 | Natural Notes | "白键":C, D, E, F, G, A, B(共 7 个)。 |
| 变化音 | Accidental Notes | "黑键":C#/Db 等(共 5 个)。 |
| 总半音数 | Total Chromatic | 所有半音的总和(12 个半音)。这是构建旋律和和声的基础积木。 |
维度 2:基于乐器范围与标准(Instrument Range)
描述实际演奏和制作中可用的具体音高范围。
| 中文术语 | 英文术语 | 描述 / 范围 |
|---|---|---|
| 标准钢琴音域 | Standard Piano Range | 现代声学钢琴上的琴键数量(A0 到 C8),共 88 个键。 |
| MIDI 标准音域 | MIDI Note Range | 数字音频工作站(DAW)中定义的音高范围,AI 模型以此理解音符数据。共 128 个音(0-127)。 |
| 人耳听觉范围 | Human Hearing Range | 人类听觉的物理极限(20Hz - 20,000Hz)。 |
维度 3:基于确定性(Definiteness)
最宏观的分类:这个声音是否能唱出调子?
| 中文术语 | 英文术语 | 描述与示例 |
|---|---|---|
| 有定音高 | Definite Pitch | 振动规则,有清晰的频率。可以唱出这些音。示例:钢琴 [Piano]、小提琴 [Violin]、人声 [Vocals]。 |
| 无定音高 | Indefinite Pitch | 振动不规则,多为噪音或打击乐。示例:小军鼓、磁带嘶嘶声 tape hiss、工业噪音 industrial textures。 |
第二部分:实战 AI 提示词指南(用于生成)
这是你在 Suno 中实际使用的提示词列表。我们将音高分为人声、乐器和音效三类。
1. 人声音高与音区(Vocal Pitch & Registers)
使用这些词汇来定义歌手的音域和性别特征。
| 类别 | 英文 AI 提示词(请用这些) | 中文说明 |
|---|---|---|
| 高音 | soprano | 女高音:音域最高的女声。 |
high notes | 高音:要求歌手唱出高音。 | |
falsetto | 假声:一种轻盈、空灵的高音唱法。 | |
head voice | 头声:高音区共鸣,听起来明亮。 | |
high-pitched hooks | 高音钩子:高亢抓耳的旋律。 | |
| 中音 | tenor | 男高音:音域最高的男声(流行乐常见)。 |
alto | 女中音:音色温暖的女声。 | |
chest voice | 胸声:中低音区,声音结实有力。 | |
belting | 高歌/喊唱:用胸声强力唱出高音。 | |
| 低音 | baritone | 男中音:中等偏低的男声,温暖厚实。 |
bass vocals | 男低音:极其低沉、共鸣强烈的人声。 | |
deep vocals | 深沉人声:营造威严或神秘感。 | |
low register | 低音区:明确要求在低音域演唱。 | |
| 音高动态 | vocal runs | 华彩跑动:快速的音高上下移动。 |
glissando | 滑音:音高平滑地滑动。 |
2. 乐器音高与频率(Instrumental Pitch & Frequency)
使用这些词汇来控制背景音乐和乐器的"高度"。
| 类别 | 英文 AI 提示词(请用这些) | 中文说明 |
|---|---|---|
| 高频(明亮) | shimmering highs | 闪烁的高频:增加空气感和光泽。 |
piercing | 穿透力:尖锐、突出的高音。 | |
bright | 明亮:音色清晰,不沉闷。 | |
glassy | 玻璃质感:透明、清脆的声音。 | |
bell tones | 钟声:清晰、有余音的高音。 | |
| 低频(厚重) | sub-bass | 超低音:主要靠身体感知的极低频率。 |
deep bass | 深沉贝斯:厚实的低音基础。 | |
rumbling drones | 隆隆持续音:营造压迫感或氛围感。 | |
808 bass | 808 贝斯:经典的电子低音,常用于 Trap/Hip-Hop。 | |
| 特定音区 | low-register synthesizers | 低音区合成器:指定合成器在低音域演奏。 |
high-register strings | 高音区弦乐:指定弦乐在高音域演奏(如小提琴高把位)。 |
3. 音高效果与调律(Pitch Effects & Tuning)
使用这些词汇来应用风格化的音高处理。
| 类别 | 英文 AI 提示词(请用这些) | 中文说明 |
|---|---|---|
| 现代/流行 | autotuned vocals | 自动调音人声:经典的 T-Pain 或现代 Trap 效果。 |
pitch correction | 音高修正:使声音听起来极其完美、机械化。 | |
robotic vocals | 机器人声:完全合成的音高感。 | |
| 复古/低保真 | detuned | 失谐:音高微偏,产生陈旧感。 |
warped | 扭曲:模拟磁带老化导致的音高波动。 | |
wobbling bass | 摇摆贝斯:音高不稳定的贝斯。 | |
| 实验性 | microtonal | 微分音:包含小于半音的音程(常见于中东音乐)。 |
fragmented pitch | 碎片化音高:音高断裂、不连续。 |
最佳实践:在 AI 音乐创作中运用音高
控制音高既微妙又强大。以下是获得最佳效果的建议。
-
使用"音区"标签来控制人声
不要只说"男声"或"女声"。明确指定人声的音高来传达情感。
- 提示:
[Verse] deep baritone vocals, storytelling style(主歌:深沉的男中音,叙事风格) - 提示:
[Chorus] powerful soprano, hitting high notes, emotional(副歌:有力的女高音,冲击高音,情感丰富)。
- 提示:
-
利用音高创造对比
优秀的歌曲通常会在低音和高音之间形成对比。在结构标签中加以利用。
- 主歌(Verse):
low register, whispery, intimate(低音区,耳语般,亲密) - 副歌(Chorus):
soaring leads, high energy, bright highs(高亢主奏,高能量,明亮高音)。
- 主歌(Verse):
-
通过频率提示氛围
音高定义了歌曲的"温度"。
- 暗黑/冷峻:
rumbling drones, low-register synthesizers, deep bass(隆隆持续音,低音区合成器,深沉贝斯)。 - 空灵/轻盈:
shimmering highs, airy textures, falsetto(闪烁高音,空灵质感,假声)。
- 暗黑/冷峻:
-
使用后期制作进行调性变更
目前的 AI 生成工具在通过文本提示改变歌曲的调性(Key)方面表现不佳(例如从 C 大调转到 D 大调)。如果你需要为生成的歌曲移调(改变音高),最佳做法是下载音频,然后使用 Audacity 或 Ableton 等外部工具手动进行变调(Pitch-shift)。
问答:关于音乐音高的常见问题
问:我可以要求 AI 用特定的调式(例如 C 大调)演唱吗?
答:你可以尝试添加 Major Key(大调)或 Minor Key(小调)这样的标签,这决定了音乐的调性和"情绪"。但指定确切的根音(如"F# 调")通常会被当前 AI 模型忽略。请专注于感觉(大调/小调),而不是具体的音名。
问:如何防止 AI 唱得太高/太刺耳?
答:添加描述词来"锚定"人声。使用 warm(温暖)、chest voice(胸声)、smooth(平滑)、baritone(男中音)或 mellow(柔和)等词汇。如果你想避免高音嘶吼,请不要在人声提示中使用 powerful(有力)或 intense(强烈)等词汇。
问:如何获得那种"摇摇晃晃"的复古音高效果?
答:使用标签 detuned(失谐)、warped(扭曲)、lo-fi(低保真)或 analog tape(模拟磁带)。这告诉 AI 模拟旧磁带或黑胶唱片的音高不稳定(抖动和漂移效果)。
在 AI 制作中掌握音乐音高
音乐音高是你声音的垂直景观。通过理解 88 个钢琴键与无限频率频谱之间的区别,并使用特定的描述词来定义音区、范围和调律,你可以雕刻出音乐的"海拔高度"。
从今天开始尝试吧。将 deep, sub-bass(深沉超低音)与 shimmering, falsetto(闪烁假声)进行对比,创造出充满动态、全频谱的 AI 乐章。