目录

快捷方式

PSD¶

class torchaudio.transforms.PSD(multi_mask: bool = False, normalize: bool = True, eps: float = 1e-15)[source]¶

计算跨通道功率谱密度（PSD）矩阵。

参数：

multi_mask (bool, 可选) – 如果为 True，则仅接受多通道时频掩码。(默认值: False)
normalize (bool, 可选) – 如果为 True，则沿时间维度标准化掩码。(默认值: True)
eps (float, 可选) – 添加到掩码标准化分母中的值。(默认值: 1e-15)

使用 PSD 的教程: 使用 MVDR 波束形成进行语音增强

使用 MVDR 波束形成进行语音增强

forward(specgram: Tensor, mask: Optional[Tensor] = None)[source]¶

参数：

specgram (torch.Tensor) – 多通道复数值频谱。张量维度为 (…, 通道, 频率, 时间)。
mask (torch.Tensor 或 None, 可选) – 用于标准化的时频掩码。如果 multi_mask 为 False，则张量维度为 (…, 频率, 时间)；如果 multi_mask 为 True，则张量维度为 (…, 通道, 频率, 时间)。(默认值: None)

返回：

输入频谱的复数值 PSD 矩阵。: 张量维度为 (…, 频率, 通道, 通道)

返回类型：

文档

查阅 PyTorch 的完整开发者文档

查看文档

教程

获取适合初学者和高级开发者的深度教程

查看教程

资源

查找开发资源并获得问题解答

查看资源