torch.istft¶

torch.istft(input, n_fft, hop_length=None, win_length=None, window=None, center=True, normalized=False, onesided=None, length=None, return_complex=False) → Tensor:¶

逆短时傅里叶变换。这预计是 stft() 的逆运算。

警告

从版本 2.1 开始，如果未指定 window，将发出警告。在未来的版本中，此属性将是必需的。请提供与 stft 调用中使用的相同的窗口。

它具有相同的参数（+ 额外可选参数 length），并且应返回原始信号的最小二乘估计。算法将使用 NOLA 条件（非零重叠）进行检查。

参数 window 和 center 的重要考虑事项是，所有窗口求和创建的包络在时间上的某个点绝不为零。具体而言， $\sum_{t=-\infty}^{\infty} |w|^2[n-t\times hop\_length] \cancel{=} 0$ 。

由于 stft() 如果信号末尾的元素无法填充到帧中，会丢弃这些元素，因此 istft 返回的信号可能比原始信号短（如果 center 为 False 可能发生，因为信号未填充）。如果在参数中给定了 length 并且它长于预期，则 istft 将在返回信号的末尾填充零。

如果 center 为 True，则会进行填充，例如 'constant'、'reflect' 等。左侧填充可以精确地去除，因为它们可以计算，但右侧填充在没有额外信息的情况下无法计算。

示例：假设最后一个窗口是：[17, 18, 0, 0, 0] 对比 [18, 0, 0, 0, 0]

参数 n_fft、hop_length、win_length 都相同，这使得无法计算右侧填充。这些额外的值可能是零，也可能是信号的反射，因此提供 length 可能很有用。如果 length 为 None，则填充将被积极地移除（会损失部分信号）。

[1] D. W. Griffin and J. S. Lim，“Signal estimation from modified short-time Fourier transform”，IEEE Trans. ASSP，第 32 卷，第 2 期，第 236-243 页，1984 年 4 月。

参数

input (Tensor) –
输入张量。期望格式与 stft() 的输出相同。即形状为 (B?, N, T) 的复数张量，其中
- B? 是可选的批量维度
- N 是频率样本数，对于 onesided 输入是 (n_fft // 2) + 1，否则是 n_fft。
- T 是帧数，对于 centered stft 是 1 + length // hop_length，否则是 1 + (length - n_fft) // hop_length。
版本 2.0 中的变化：不再支持实数数据类型输入。输入现在必须具有复数数据类型，如 stft(..., return_complex=True) 返回的那样。
n_fft (int) – 傅里叶变换大小
hop_length (Optional[int]) – 相邻滑动窗口帧之间的距离。(默认值: n_fft // 4)
win_length (Optional[int]) – 窗口帧和 STFT 滤波器的大小。(默认值: n_fft)
window (Optional[torch.Tensor]) – 可选的窗口函数。形状必须是一维且 <= n_fft。(默认值: torch.ones(win_length))
center (bool) – 输入是否在两侧进行填充，使得第 $t$ 帧以时间 $t \times \text{hop\_length}$ 为中心。(默认值: True)
normalized (bool) – STFT 是否已归一化。(默认值: False)
onesided (Optional[bool]) – STFT 是否是单侧的。(默认值: 如果输入大小中的 n_fft != fft_size 则为 True)
length (Optional[int]) – 信号的修剪量（即原始信号长度）。对于 centered stft，默认为 (T - 1) * hop_length，否则为 n_fft + (T - 1) * hop_length，其中 T 是输入帧数。
return_complex (Optional[bool]) – 输出是否应为复数，或者输入是否应假定源自实信号和窗口。请注意，这与 onesided=True 不兼容。(默认值: False)

返回值

原始信号的最小二乘估计，形状为 (B?, length)，其中: B? 是输入张量中的可选批量维度。

返回类型

Tensor

torch.istft¶

文档

教程

资源