torchaudio.functional.inverse_spectrogram¶
- torchaudio.functional.inverse_spectrogram(spectrogram: Tensor, length: Optional[int], pad: int, window: Tensor, n_fft: int, hop_length: int, win_length: int, normalized: Union[bool, str], center: bool = True, pad_mode: str = 'reflect', onesided: bool = True) Tensor [source]¶
从提供的复值频谱图创建逆频谱图或一批逆频谱图。
- 参数:
spectrogram (Tensor) – 维度为 (…, freq, time) 的音频复数张量。
length (int or None) – 波形的输出长度。
pad (int) – 信号的双边填充。仅在提供
length
时有效。window (Tensor) – 应用/乘以每个帧/窗口的窗口张量
n_fft (int) – FFT 的大小
hop_length (int) – STFT 窗口之间跳跃的长度
win_length (int) – 窗口大小
normalized (bool or str) – STFT 输出是否按幅度归一化。如果输入是字符串,则选择为
"window"
和"frame_length"
,取决于归一化模式。True
映射到"window"
。center (bool, 可选) – 波形是否在两侧填充,以便第 \(t\) 帧以时间 \(t \times \text{hop\_length}\) 为中心。默认值:
True
pad_mode (字符串, 可选) – 控制当
center
为True
时使用的填充方法。此参数是为了与频谱图函数兼容而提供的,未被使用。默认值:"reflect"
onesided (bool, 可选) – 控制频谱图是否以单边模式完成。默认值:
True
- 返回值:
维度为 (…, time)。原始信号的最小二乘估计。
- 返回类型:
张量