Resample¶
- class torchaudio.transforms.Resample(orig_freq: int = 16000, new_freq: int = 16000, resampling_method: str = 'sinc_interp_hann', lowpass_filter_width: int = 6, rolloff: float = 0.99, beta: Optional[float] = None, *, dtype: Optional[dtype] = None)[source]¶
将信号从一个频率重采样到另一个频率。可以指定重采样方法。
注意
如果在高于 float32 精度的波形上进行重采样,则可能会有少量精度损失,因为内核缓存为 float32 一次。如果高精度重采样对您的应用很重要,则函数形式将保留更高的精度,但运行速度会较慢,因为它不缓存内核。或者,您可以重写一个变换,以缓存更高精度的内核。
- 参数:
orig_freq (int, 可选) – 信号的原始频率。(默认:
16000
)new_freq (int, 可选) – 期望的频率。(默认:
16000
)resampling_method (str, 可选) – 要使用的重采样方法。选项:[
sinc_interp_hann
,sinc_interp_kaiser
](默认:"sinc_interp_hann"
)lowpass_filter_width (int, 可选) – 控制滤波器的锐度,值越大 == 越锐利但效率越低。(默认:
6
)rolloff (float, 可选) – 滤波器的滚降频率,作为奈奎斯特频率的一部分。较低的值会减少抗锯齿,但也会减少一些最高频率。(默认:
0.99
)beta (float 或 None, 可选) – 用于 kaiser 窗口的形状参数。
dtype (torch.device, 可选) – 确定预先计算和缓存重采样内核的精度。如果未提供,则内核将使用
torch.float64
计算,然后缓存为torch.float32
。如果您需要更高的精度,请提供torch.float64
,预先计算的内核将使用torch.float64
计算并缓存。如果您使用较低精度的重采样,请使用Resample.to(dtype)
而不是提供此参数,以便内核生成仍然在torch.float64
上执行。
- 示例
>>> waveform, sample_rate = torchaudio.load("test.wav", normalize=True) >>> transform = transforms.Resample(sample_rate, sample_rate/10) >>> waveform = transform(waveform)
- 使用
Resample
的教程