快捷方式

PSD

class torchaudio.transforms.PSD(multi_mask: bool = False, normalize: bool = True, eps: float = 1e-15)[source]

计算跨通道功率谱密度(PSD)矩阵。

This feature supports the following devices: CPU, CUDA This API supports the following properties: Autograd, TorchScript
参数:
  • multi_mask (bool, 可选) – 如果为 True,则仅接受多通道时频掩码。(默认值: False)

  • normalize (bool, 可选) – 如果为 True,则沿时间维度标准化掩码。(默认值: True)

  • eps (float, 可选) – 添加到掩码标准化分母中的值。(默认值: 1e-15)

使用 PSD 的教程
Speech Enhancement with MVDR Beamforming

使用 MVDR 波束形成进行语音增强

使用 MVDR 波束形成进行语音增强
forward(specgram: Tensor, mask: Optional[Tensor] = None)[source]
参数:
  • specgram (torch.Tensor) – 多通道复数值频谱。张量维度为 (…, 通道, 频率, 时间)

  • mask (torch.TensorNone, 可选) – 用于标准化的时频掩码。如果 multi_mask 为 False,则张量维度为 (…, 频率, 时间);如果 multi_mask 为 True,则张量维度为 (…, 通道, 频率, 时间)。(默认值: None)

返回:

输入频谱的复数值 PSD 矩阵。

张量维度为 (…, 频率, 通道, 通道)

返回类型:

torch.Tensor

文档

查阅 PyTorch 的完整开发者文档

查看文档

教程

获取适合初学者和高级开发者的深度教程

查看教程

资源

查找开发资源并获得问题解答

查看资源