快捷方式

torchaudio.functional.resample

torchaudio.functional.resample(waveform: Tensor, orig_freq: int, new_freq: int, lowpass_filter_width: int = 6, rolloff: float = 0.99, resampling_method: str = 'sinc_interp_hann', beta: Optional[float] = None) Tensor[source]

使用带限插值将波形重采样到新频率。 [Smith, 2020]

This feature supports the following devices: CPU, CUDA This API supports the following properties: Autograd, TorchScript

注意

transforms.Resample 预先计算并重用重采样内核,因此如果使用相同的重采样参数对多个波形进行重采样,则使用它可以提高计算效率。

参数:
  • waveform (Tensor) – 维度为 (…, time) 的输入信号

  • orig_freq (int) – 信号的原始频率

  • new_freq (int) – 期望的频率

  • lowpass_filter_width (int, 可选) – 控制滤波器的锐度,值越大 == 越锐利但效率越低。(默认值:6

  • rolloff (float, 可选) – 滤波器的滚降频率,为奈奎斯特频率的一部分。较低的值会减少抗锯齿,但也会降低一些最高频率。(默认值:0.99

  • resampling_method (str, 可选) – 要使用的重采样方法。选项:["sinc_interp_hann", "sinc_interp_kaiser"](默认值:"sinc_interp_hann"

  • beta (floatNone, 可选) – 用于 kaiser 窗口的形状参数。

返回:

新频率下的波形,维度为 (…, time).

返回类型:

Tensor

使用 resample 的教程
Speech Recognition with Wav2Vec2

使用 Wav2Vec2 进行语音识别

使用 Wav2Vec2 进行语音识别
Torchaudio-Squim: Non-intrusive Speech Assessment in TorchAudio

Torchaudio-Squim: TorchAudio 中的非侵入式语音评估

Torchaudio-Squim: TorchAudio 中的非侵入式语音评估
Audio Feature Extractions

音频特征提取

音频特征提取
ASR Inference with CTC Decoder

使用 CTC 解码器进行 ASR 推理

使用 CTC 解码器进行 ASR 推理
Audio Resampling

音频重采样

音频重采样

文档

访问 PyTorch 的综合开发者文档

查看文档

教程

获取面向初学者和高级开发者的深入教程

查看教程

资源

查找开发资源并获得解答

查看资源