TimeStretch¶
- class torchaudio.transforms.TimeStretch(hop_length: Optional[int] = None, n_freq: int = 201, fixed_rate: Optional[float] = None)[source]¶
在不修改音调的情况下,根据给定速率拉伸 STFT 的时间。
在SpecAugment [Park 等人,2019]中提出。
- 参数:
注意
预期输入为原始的复值频谱图。
- 示例
>>> spectrogram = torchaudio.transforms.Spectrogram(power=None) >>> stretch = torchaudio.transforms.TimeStretch() >>> >>> original = spectrogram(waveform) >>> stretched_1_2 = stretch(original, 1.2) >>> stretched_0_9 = stretch(original, 0.9)
- 使用
TimeStretch
的教程 - 音频特征增强
- forward(complex_specgrams: Tensor, overriding_rate: Optional[float] = None) Tensor [source]¶
- 参数:
complex_specgrams (Tensor) – 维度为 (…, freq, num_frame) 且具有复数数据类型的张量。
overriding_rate (float 或 None,可选) – 要应用于此批次的加速。如果没有传递速率,则使用
self.fixed_rate
。(默认值:None
)
- 返回值:
拉伸后的频谱图。生成的张量与输入频谱图具有相应复数数据类型,并且帧数更改为
ceil(num_frame / rate)
。- 返回类型:
Tensor