torchaudio.functional.compute_deltas¶
- torchaudio.functional.compute_deltas(specgram: Tensor, win_length: int = 5, mode: str = 'replicate') Tensor [source]¶
计算张量的 delta 系数,通常是频谱图
\[d_t = \frac{\sum_{n=1}^{\text{N}} n (c_{t+n} - c_{t-n})}{2 \sum_{n=1}^{\text{N}} n^2} \]其中 \(d_t\) 是时间 \(t\) 处的 deltas,\(c_t\) 是时间 \(t\) 处的频谱图系数,\(N\) 是
(win_length-1)//2
。- 参数:
- 返回值:
维度为 (…, freq, time) 的 delta 张量
- 返回类型:
张量
- 示例
>>> specgram = torch.randn(1, 40, 1000) >>> delta = compute_deltas(specgram) >>> delta2 = compute_deltas(delta)