快捷方式

PSD

class torchaudio.transforms.PSD(multi_mask: bool = False, normalize: bool = True, eps: float = 1e-15)[source]

计算跨通道功率谱密度 (PSD) 矩阵。

This feature supports the following devices: CPU, CUDA This API supports the following properties: Autograd, TorchScript
参数:
  • multi_mask (bool, 可选) – 如果 True,则仅接受多通道时频掩码。(默认值:False

  • normalize (bool, 可选) – 如果 True,则沿时间维度标准化掩码。(默认值:True

  • eps (float, 可选) – 用于掩码归一化中添加到分母的值。(默认值:1e-15

使用 PSD 的教程
Speech Enhancement with MVDR Beamforming

使用 MVDR 波束成形的语音增强

使用 MVDR 波束成形的语音增强
forward(specgram: Tensor, mask: Optional[Tensor] = None)[source]
参数:
  • specgram (torch.Tensor) – 多通道复值频谱。维度为 (…, channel, freq, time) 的张量。

  • mask (torch.TensorNone, 可选) – 用于归一化的时频掩码。如果 multi_mask 为 False,则维度为 (…, freq, time) 的张量;如果 multi_mask 为 True,则维度为 (…, channel, freq, time) 的张量。(默认值:None

返回:

输入频谱的复值 PSD 矩阵。

维度为 (…, freq, channel, channel) 的张量

返回类型:

torch.Tensor

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取面向初学者和高级开发者的深入教程

查看教程

资源

查找开发资源并获得问题解答

查看资源