HDemucs¶
- class torchaudio.models.HDemucs(sources: List[str], audio_channels: int = 2, channels: int = 48, growth: int = 2, nfft: int = 4096, depth: int = 6, freq_emb: float = 0.2, emb_scale: int = 10, emb_smooth: bool = True, kernel_size: int = 8, time_stride: int = 2, stride: int = 4, context: int = 1, context_enc: int = 0, norm_starts: int = 4, norm_groups: int = 4, dconv_depth: int = 2, dconv_comp: int = 4, dconv_attn: int = 4, dconv_lstm: int = 4, dconv_init: float = 0.0001)[source]¶
来自《混合频谱图和波形源分离》[Défossez, 2021]的 Hybrid Demucs 模型。
另请参阅
torchaudio.pipelines.SourceSeparationBundle
: 带有预训练模型的源分离流水线。
- 参数:
sources (List[str]) – 源名称列表。列表可以包含以下源选项:[
"bass"
,"drums"
,"other"
,"mixture"
,"vocals"
]。audio_channels (int, optional) – 输入/输出音频通道数。(默认值:2)
channels (int, optional) – 初始隐藏通道数。(默认值:48)
growth (int, optional) – 每层增加隐藏通道数的倍数。(默认值:2)
nfft (int, optional) – FFT 频段数。请注意,更改此参数需要仔细计算各种形状参数,并且对于混合模型而言无法开箱即用。(默认值:4096)
depth (int, optional) – 编码器和解码器中的层数(默认值:6)
freq_emb (float, optional) – 如果 > 0,则在第一个频率层之后添加频率嵌入,实际值控制嵌入的权重。(默认值:0.2)
emb_scale (int, optional) – 等效于缩放嵌入学习率(默认值:10)
emb_smooth (bool, optional) – 使用平滑的嵌入(相对于频率)进行初始化。(默认值:
True
)kernel_size (int, optional) – 编码器和解码器层的内核大小。(默认值:8)
time_stride (int, optional) – 合并后最终时间层的步长。(默认值:2)
stride (int, optional) – 编码器和解码器层的步长。(默认值:4)
context (int, optional) – 解码器中 1x1 卷积的上下文。(默认值:4)
context_enc (int, optional) – 编码器中 1x1 卷积的上下文。(默认值:0)
norm_starts (int, optional) – 开始使用组归一化的层。解码器层按相反顺序编号。(默认值:4)
norm_groups (int, optional) – 组归一化的组数。(默认值:4)
dconv_depth (int, optional) – 残差 DConv 分支的深度。(默认值:2)
dconv_comp (int, optional) – DConv 分支的压缩率。(默认值:4)
dconv_attn (int, optional) – 从该层开始在 DConv 分支中添加注意力层。(默认值:4)
dconv_lstm (int, optional) – 从该层开始在 DConv 分支中添加 LSTM 层。(默认值:4)
dconv_init (float, optional) – DConv 分支 LayerScale 的初始缩放比例。(默认值:1e-4)
- 使用
HDemucs
的教程 - 使用 Hybrid Demucs 进行音乐源分离
方法¶
前向传播¶
- HDemucs.forward(input: Tensor)[source]¶
HDemucs 前向调用
- 参数:
input (torch.Tensor) – 形状为 (batch_size, channel, num_frames) 的混合输入张量
- 返回值:
- 张量
输出张量,拆分为形状为 (batch_size, num_sources, channel, num_frames) 的源
工厂函数¶
构建 |
|
构建 |
|
构建 |