快捷方式

torchaudio.functional.resample

torchaudio.functional.resample(waveform: Tensor, orig_freq: int, new_freq: int, lowpass_filter_width: int = 6, rolloff: float = 0.99, resampling_method: str = 'sinc_interp_hann', beta: Optional[float] = None) Tensor[source]

使用带限插值将波形重采样到新频率。 [Smith, 2020]

This feature supports the following devices: CPU, CUDA This API supports the following properties: Autograd, TorchScript

注意

transforms.Resample 会预先计算并重用重采样核,因此如果使用相同的重采样参数重采样多个波形,使用它会产生更高效的计算。

参数:
  • waveform (Tensor) – 输入信号,维度为 (…, time)

  • orig_freq (int) – 信号的原始频率

  • new_freq (int) – 所需频率

  • lowpass_filter_width (int, 可选) – 控制滤波器的锐度,越大越锐利但效率越低。(默认值: 6)

  • rolloff (float, 可选) – 滤波器的滚降频率,作为奈奎斯特频率的一部分。值越低越减少抗锯齿,但也会削弱一些最高频率。(默认值: 0.99)

  • resampling_method (str, 可选) – 要使用的重采样方法。选项:["sinc_interp_hann", "sinc_interp_kaiser"] (默认值: "sinc_interp_hann")

  • beta (floatNone, 可选) – 用于 kaiser 窗的形状参数。

返回:

新频率下的波形,维度为 (…, time)。

返回类型:

Tensor

使用 resample 的教程
Speech Recognition with Wav2Vec2

使用 Wav2Vec2 进行语音识别

使用 Wav2Vec2 进行语音识别
Torchaudio-Squim: Non-intrusive Speech Assessment in TorchAudio

Torchaudio-Squim:TorchAudio 中的非侵入式语音评估

Torchaudio-Squim:TorchAudio 中的非侵入式语音评估
Audio Feature Extractions

音频特征提取

音频特征提取
ASR Inference with CTC Decoder

使用 CTC 解码器进行 ASR 推理

使用 CTC 解码器进行 ASR 推理
Audio Resampling

音频重采样

音频重采样

文档

访问 PyTorch 的综合开发者文档

查看文档

教程

获取面向初学者和高级开发者的深度教程

查看教程

资源

查找开发资源并获得问题解答

查看资源