快捷方式

torchaudio.functional.add_noise

torchaudio.functional.add_noise(waveform: Tensor, noise: Tensor, snr: Tensor, lengths: Optional[Tensor] = None) Tensor[source]

根据信噪比缩放波形并添加噪声。

具体来说,对于每对波形向量 \(x \in \mathbb{R}^L\) 和噪声向量 \(n \in \mathbb{R}^L\),该函数计算输出 \(y\)

\[y = x + a n \, \text{,} \]

其中

\[a = \sqrt{ \frac{ ||x||_{2}^{2} }{ ||n||_{2}^{2} } \cdot 10^{-\frac{\text{SNR}}{10}} } \, \text{,} \]

其中 \(\text{SNR}\) 是期望的信号与噪声比,单位为 dB。

请注意,此函数以与上述公式和 PyTorch 的广播语义一致的方式广播其输入中的单例前导维度。

This feature supports the following devices: CPU, CUDA This API supports the following properties: Autograd, TorchScript
参数:
  • waveform (torch.Tensor) – 输入波形,形状为 (…, L)

  • noise (torch.Tensor) – 噪声,形状为 (…, L) (与 waveform 相同的形状)。

  • snr (torch.Tensor) – 信噪比,单位为 dB,形状为 (…,)

  • lengths (torch.TensorNone, 可选) – waveformnoise 中信号的有效长度,形状为 (…,) (前导维度必须与 waveform 的维度匹配)。如果为 None,则 waveformnoise 中的所有元素都将被视为有效。(默认值:None)

返回:

缩放并将 noise 添加到 waveform 的结果,形状为 (…, L) (与 waveform 相同的形状)。

返回类型:

torch.Tensor

使用 add_noise 的教程
Torchaudio-Squim: Non-intrusive Speech Assessment in TorchAudio

Torchaudio-Squim:TorchAudio 中的非侵入式语音评估

Torchaudio-Squim:TorchAudio 中的非侵入式语音评估
Audio Data Augmentation

音频数据增强

音频数据增强

文档

访问 PyTorch 的综合开发者文档

查看文档

教程

获取面向初学者和高级开发者的深度教程

查看教程

资源

查找开发资源并获得解答

查看资源