快捷方式

torchaudio.functional.inverse_spectrogram

torchaudio.functional.inverse_spectrogram(spectrogram: Tensor, length: Optional[int], pad: int, window: Tensor, n_fft: int, hop_length: int, win_length: int, normalized: Union[bool, str], center: bool = True, pad_mode: str = 'reflect', onesided: bool = True) Tensor[source]

从提供的复值频谱图创建逆频谱图或一批逆频谱图。

This feature supports the following devices: CPU, CUDA This API supports the following properties: Autograd, TorchScript
参数:
  • spectrogram (Tensor) – 维度为 (…, freq, time) 的音频复数张量。

  • length (int or None) – 波形的输出长度。

  • pad (int) – 信号的双边填充。仅在提供 length 时有效。

  • window (Tensor) – 应用/乘以每个帧/窗口的窗口张量

  • n_fft (int) – FFT 的大小

  • hop_length (int) – STFT 窗口之间跳跃的长度

  • win_length (int) – 窗口大小

  • normalized (bool or str) – STFT 输出是否按幅度归一化。如果输入是字符串,则选择为 "window""frame_length",取决于归一化模式。 True 映射到 "window"

  • center (bool, 可选) – 波形是否在两侧填充,以便第 \(t\) 帧以时间 \(t \times \text{hop\_length}\) 为中心。默认值: True

  • pad_mode (字符串, 可选) – 控制当 centerTrue 时使用的填充方法。此参数是为了与频谱图函数兼容而提供的,未被使用。默认值: "reflect"

  • onesided (bool, 可选) – 控制频谱图是否以单边模式完成。默认值: True

返回值:

维度为 (…, time)。原始信号的最小二乘估计。

返回类型:

张量

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取面向初学者和高级开发人员的深入教程

查看教程

资源

查找开发资源并获得问题的解答

查看资源