快捷方式

TimeStretch

class torchaudio.transforms.TimeStretch(hop_length: Optional[int] = None, n_freq: int = 201, fixed_rate: Optional[float] = None)[source]

在不修改给定速率的音调的情况下,及时拉伸 stft。

This feature supports the following devices: CPU, CUDA This API supports the following properties: Autograd, TorchScript

SpecAugment [Park et al., 2019] 中提出。

参数:
  • hop_length (intNone, 可选) – STFT 窗口之间的跳跃长度。(默认值:n_fft // 2,其中 n_fft == (n_freq - 1) * 2)

  • n_freq (int, 可选) – 来自 stft 的滤波器组的数量。(默认值:201

  • fixed_rate (floatNone, 可选) – 加速或减速的比率。如果未提供 None,则必须将比率传递给 forward 方法。(默认值:None

注意

预期的输入是原始的复数值频谱图。

示例
>>> spectrogram = torchaudio.transforms.Spectrogram(power=None)
>>> stretch = torchaudio.transforms.TimeStretch()
>>>
>>> original = spectrogram(waveform)
>>> stretched_1_2 = stretch(original, 1.2)
>>> stretched_0_9 = stretch(original, 0.9)
The visualization of stretched spectrograms.
使用 TimeStretch 的教程
Audio Feature Augmentation

音频特征增强

音频特征增强
forward(complex_specgrams: Tensor, overriding_rate: Optional[float] = None) Tensor[source]
参数:
  • complex_specgrams (Tensor) – 维度为 (…, freq, num_frame) 且具有复数 dtype 的张量。

  • overriding_rate (floatNone, 可选) – 应用于此批次的加速比率。如果未传递比率,则使用 self.fixed_rate。(默认值:None

返回:

拉伸的频谱图。结果张量与输入频谱图具有相应的复数 dtype,帧数更改为 ceil(num_frame / rate)

返回类型:

Tensor

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取面向初学者和高级开发者的深入教程

查看教程

资源

查找开发资源并获得您的问题解答

查看资源