快捷方式

torchaudio.functional.compute_deltas

torchaudio.functional.compute_deltas(specgram: Tensor, win_length: int = 5, mode: str = 'replicate') Tensor[source]

计算张量的 delta 系数,通常是频谱图

This feature supports the following devices: CPU, CUDA This API supports the following properties: TorchScript
\[d_t = \frac{\sum_{n=1}^{\text{N}} n (c_{t+n} - c_{t-n})}{2 \sum_{n=1}^{\text{N}} n^2} \]

其中 \(d_t\) 是时间 \(t\) 的 delta 值,\(c_t\) 是时间 \(t\) 的频谱图系数,\(N\)(win_length-1)//2

参数:
  • specgram (Tensor) – 音频张量,维度为 (…, freq, time)

  • win_length (int, 可选) – 用于计算 delta 的窗口长度 (默认值: 5)

  • mode (str, 可选) – 传递给 padding 的模式参数 (默认值: "replicate")

返回:

delta 张量,维度为 (…, freq, time)

返回类型:

Tensor

示例
>>> specgram = torch.randn(1, 40, 1000)
>>> delta = compute_deltas(specgram)
>>> delta2 = compute_deltas(delta)

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取面向初学者和高级开发者的深入教程

查看教程

资源

查找开发资源并获得您的问题解答

查看资源