快捷方式

PSD

class torchaudio.transforms.PSD(multi_mask: bool = False, normalize: bool = True, eps: float = 1e-15)[source]

计算跨通道功率谱密度 (PSD) 矩阵。

This feature supports the following devices: CPU, CUDA This API supports the following properties: Autograd, TorchScript
参数:
  • multi_mask (bool, 可选) – 如果 True,则只接受多通道时频掩码。(默认值:False

  • normalize (bool, 可选) – 如果 True,则沿时间维度规范化掩码。(默认值:True

  • eps (float, 可选) – 添加到掩码规范化中分母的值。(默认值:1e-15

使用 PSD 的教程
Speech Enhancement with MVDR Beamforming

使用 MVDR 波束形成进行语音增强

使用 MVDR 波束形成进行语音增强
forward(specgram: Tensor, mask: Optional[Tensor] = None)[source]
参数:
  • specgram (torch.Tensor) – 多通道复值频谱。张量维度为 (…, channel, freq, time)

  • mask (torch.TensorNone, 可选) – 用于规范化的时频掩码。如果 multi_mask 为 False,则张量维度为 (…, freq, time);如果 multi_mask 为 True,则张量维度为 (…, channel, freq, time)。(默认值:None

返回值:

输入频谱的复值 PSD 矩阵。

张量维度为 (…, freq, channel, channel)

返回类型:

torch.Tensor

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取针对初学者和高级开发人员的深入教程

查看教程

资源

查找开发资源并获得解答

查看资源