音乐中的 Stems 是什么?如何从任意曲目中获取音轨/Stems

2026年5月22日

音乐中的 Stems 是什么?如何从任意曲目中获取音轨/Stems

了解音频 stems 在音乐中的含义、与多轨录音的区别、在哪里可以找到免费 stems,以及如何在 Mac 上从任意歌曲中提取人声和伴奏 stems。

“Stems"这个词出现在混音大赛规则、版权合同和制作人论坛中,但其定义因使用者而异。本文将介绍音频 stems 在音乐制作中的实际含义、与多轨录音的区别、在哪里可以找到免费歌曲 stems,以及如何在 Mac 上从您拥有的任意歌曲中提取人声和伴奏 stems。如果您想从一首从未发布过官方 stems 的歌曲中获取音轨,AI 分离是唯一实用的选项,本指南也涵盖了这方面的内容。

音乐中的 Stems 是什么?

在音乐制作中,stems(音轨)是一首完成曲目的子混音。您得到的不是整首歌的一个立体声文件,而是多个文件:一个用于人声,一个用于鼓组,一个用于贝斯,依此类推。每个 stem 包含一组相关音频元素的混合。

这个术语来源于广播和后期制作领域。当工程师为电影或电视交付混音时,他们会导出分组子混音,以便接收方编辑人员可以在不返回原始工程的情况下调整音量平衡。音乐制作随后采用了同样的工作流程。

Stems、音轨与多轨录音的区别

这三个术语经常被混用,但它们含义不同:

  • 多轨录音(Multitrack): 原始录音棚录音中的每一个单独元素。每个麦克风、乐器或合成器各一个文件。一张典型专辑可能产生 60 条或更多的单独音轨,这是制作人在 DAW 中处理的原始素材。
  • Stems(音轨): 相关元素组合并渲染到一起。所有鼓组成为一个鼓组 stem,所有合成器垫音成为一个垫音 stem。通常是 4 至 8 个文件,而非 60 个。
  • 混音(Mix): 最终的立体声文件,所有内容合并为一个。

Stems 处于中间位置:比最终混音有更多细节,比完整录音棚工程有更少粒度。这种中间层级正是大多数混音师、现场表演者和版权授权客户实际需要的。

音乐中 Stems 的重要性

混音师使用原始 stems 围绕原始素材构建新编曲。保留人声,替换节拍,在下方加入新的制作层。没有 stems,您只能对着空洞的清唱,或者努力绕开原版伴奏的串音。

现场表演者使用 stems 代替立体声伴奏音轨,这样调音师就能控制各个独立元素。他们可以根据场地需要提升鼓组 stem 的音量,或在安静的主歌部分压低垫音。立体声混音让他们完全失去控制权。

音乐监制及影视编辑请求 stems,以便在对话下方淡出、切到不同段落,或为特定场景调整音量平衡。单一立体声文件让精确放置变得困难。

制作人和学生使用 stems 研究录音。在经典曲目上单独聆听鼓组 stem,能揭示在完整混音中消失的编曲和制作决策,是训练耳朵最快捷的方式之一。

歌手和器乐演奏者使用人声与伴奏的分离进行练习。去掉主唱人声,跟着伴奏演唱;去掉乐器部分,对着原始人声表演练习。

在哪里获取热门歌曲的免费 Stems

这是大多数人真正想弄清楚的问题。以下是对现有资源的真实梳理。

混音大赛与官方 stems 发布: 一些艺人和厂牌会在混音大赛期间发布官方 stems。Splice 上有很多此类资源。Beatport 的混音大赛通常在参赛期间提供 stem 下载。这些是质量最高的 stems,因为它们直接来自原始录音棚工程,没有任何估算或分离成分。如果您想处理的歌曲有相关大赛,这是首选起点。

Bandcamp 艺人页面: 少数艺人在 Bandcamp 上随专辑一起出售 stem 包。在 Bandcamp 上搜索艺人名称加上"stems”。这在接受混音文化的电子音乐制作人中更为常见。

艺人免费 stem 包: 偶尔,艺人会直接通过其官网、SoundCloud 或作为推广素材发布 stem 包。电子音乐艺人比其他类型的艺人更常这样做。搜索艺人名称加"stem pack"或"acapella",查找已发布的内容。

免版税音乐库: Splice、Looperman 及各类制作人素材库出售免版税曲目的 stems。这些不是已发行商业歌曲的 stems,但在商业使用上是合规的。

AI 音轨/stems 提取: 对于您拥有的任意无 DRM 歌曲,AI 分离工具可以从混合音轨中估算出 stems。质量无法与拥有原始录音棚文件相比,但对于人声和伴奏的分离,当前 AI 的结果对于练习、卡拉 OK、采样以及许多混音应用来说已经足够好。这是从从未正式发布过 stems 的歌曲中获取音轨的唯一方式,而这覆盖了绝大多数已录制的音乐。

最实用的 Stems 分离:人声与伴奏

对于大多数实际用途而言,您只需要两个 stems:人声伴奏。这种两轨分离正是卡拉 OK 伴奏所使用的,也是翻唱歌手用来练习的,以及大多数混音项目的起点。

包含独立鼓组、贝斯和旋律的完整 stems 套装在某些专业场景中很有用,但提取难度更大,因为这些元素共享频率范围,会相互串音。人声和伴奏的分离更可靠,因为人声具有与大多数乐器明显不同的声学特征。

AI 分离在这种两轨分离上表现最佳。如果您只需要去除人声或去除音乐部分,将能持续获得可用的结果。

如何在 Mac 上使用 SongSplit AI 提取歌曲 Stems

SongSplit AI 使用 Apple 的 Neural Engine 完全在您的 Mac 上运行。无需上传,无需订阅。文件全程留在您的本机。

第一步:获取无 DRM 的音频文件。 您需要 MP3、WAV、FLAC、M4A 或 AIFF 格式的歌曲文件。在 Apple Music 流媒体转型之前从 iTunes Store 购买的歌曲通常是无 DRM 的。Bandcamp 下载效果很好。如果您使用的是 Apple Music 流媒体订阅,则需要另行购买该曲目或使用您已有的文件。

第二步:打开 SongSplit AI。 启动应用,您将在窗口中央看到一个简洁的拖放区域。

第三步:拖入您的音频文件。 将文件从访达直接拖入 SongSplit 窗口,或点击拖放区域打开文件选择器。SongSplit 支持 MP3、WAV、FLAC、M4A、AIFF 及大多数常见音频格式。

第四步:选择处理模式。 SongSplit 提供快速模式和质量模式。对于制作或任何计划发布的内容,请使用质量模式。快速模式适合快速预览。

第五步:让 Apple Neural Engine 处理文件。 处理在设备端运行。搭载 M 系列芯片的 Mac 处理一首典型歌曲需要两到三分钟。没有任何内容离开您的本机。

第六步:预览并导出。 处理完成后,您将获得两个 stems:人声和伴奏。在 SongSplit 中逐一试听后再导出。将两个 stems 以 M4A 文件形式导出至您 Mac 上的任意文件夹。

第七步:在您的项目中使用。 将 M4A 文件拖入 Logic、GarageBand、Ableton、Pro Tools、视频编辑软件或卡拉 OK 播放器。它们是与任何现代软件兼容的标准音频文件。

在 App Store 下载 SongSplit AI 或获取 Mac 直接下载版本。免费试用,一次性购买。

AI 分离擅长什么(以及局限在哪里)

AI 音轨/stems 分离在人声和伴奏的分离上已经真正做到了不错的水准。现代模型在大量数据集上训练,对于大多数实际用途,结果是可用的。

难度增加的地方:将各个乐器彼此分离。鼓组、贝斯和吉他共享频率范围,并在时间维度上以难以干净分离的方式重叠。如果您需要从一张制作密集的流行专辑中获取干净的独立鼓组 stem,结果的变化会比人声分离更大。

SongSplit AI 专注于人声和伴奏的分离,因为这是质量能持续保持足够高且实用的领域。它不尝试完整的多轨分离,这样才能将质量保持在应有的水准。

需要注意的一点是:AI 分离是估算,而非分解。模型基于训练期间学到的规律推断人声可能的声音。在复杂录音上,您可能会听到轻微的串音瑕疵。对于卡拉 OK、练习和采样,这通常不是问题。对于专业混音发行,请选择那些能干净分离的录音。

对于没有官方 stems 的商业歌曲,从您拥有的文件中进行 AI 提取是唯一实用的选项。

常见问题

stem 和采样(sample)有什么区别?

采样(sample)是从录音中截取的一小段音频片段:一个鼓击、一段贝斯 riff、一句人声短句。stem 是整首歌中某个元素或一组元素的完整子混音。stem 包含从头到尾完整的鼓组表演;采样可能只是该鼓组 stem 中的一小节。

我能免费获取任意歌曲的 stems 吗?

官方 stems 只存在于少数已发行商业音乐中,通常通过混音大赛分发,或由艺人自行发布。对于大多数歌曲,从无 DRM 音频文件中进行 AI 提取是唯一的选项。质量对于大多数实际用途(卡拉 OK、练习、轻量混音工作)已足够好,但这是估算,而非来自原始录音棚的真实 stem。

Stems 通常是什么格式?

来自专业录音棚的官方 stems 几乎总是 WAV 文件:原始录音棚采样率和位深的无损音频,通常为 44.1 kHz / 24-bit 或 48 kHz / 24-bit。SongSplit AI 提取的 stems 导出为 M4A,即 AAC 编码文件。M4A 质量高,可在任何地方播放,但它是压缩格式。如果您需要用于母带处理或广播的无压缩 WAV,可以使用 ffmpeg 等标准工具或任何 DAW 将 M4A 转换为 WAV。

Stems 和多轨录音(multitracks)是一回事吗?

不是。多轨录音(multitracks)是录音棚工程中每个单独录制元素的集合,可能有几十个文件。Stems 是将相关元素合并为一个文件的分组子混音。鼓组多轨可能包含 15 条或更多单独音轨(底鼓、军鼓、踩镲、顶置麦克风、房间麦克风等);鼓组 stem 则是所有这些渲染在一起的一个文件。

SongSplit AI 能单独分离鼓组、贝斯和吉他吗?

不能。SongSplit AI 产生两个 stems:人声 stem 和伴奏 stem。这是有意为之的专注方向。人声与伴奏分离的质量持续高水准,而将各个乐器彼此分离会引入更多串音和瑕疵。如果您需要单独的鼓组、贝斯和吉他 stems,LALAL.AI 或类似的多轨分离服务可以尝试这种分离,但在复杂素材上,每条 stem 的瑕疵会更多。

哪些歌曲最适合 AI 音轨/stems 提取?

大约 1990 年以后的流行、摇滚、R&B、乡村和嘻哈录音通常分离效果良好。录音越干净,人声与乐器部分越清晰,结果就越好。有完整现场乐队演奏、混响较重的密集爵士乐,实验性音乐中经过大量人声处理的素材,或非常老的单声道录音,对任何 AI 分离工具来说都更难处理。

从我拥有的歌曲中提取 stems 合法吗?

这取决于您所在的司法管辖区和使用目的。一般来说,为个人练习或学习创建个人副本,与将提取的 stems 用于商业发行或公开演出,在法律上被区别对待。如果您计划发布混音或在制作中使用某个 stem,您需要从权利持有人处获得相应授权。AI 提取不改变基础版权状况。

相关指南

关于从任意歌曲提取人声的分步指南:如何从歌曲中提取人声

关于从任意歌曲制作卡拉 OK 伴奏:如何制作卡拉 OK 伴奏

关于 Mac 上人声消除工具的对比:Mac 最佳人声消除应用

SongSplit AI

准备好开始分离了吗?

下载 SongSplit AI,立即开始分离您喜爱的歌曲。

下载自
App Store