快捷方式

torchaudio.functional.melscale_fbanks

torchaudio.functional.melscale_fbanks(n_freqs: int, f_min: float, f_max: float, n_mels: int, sample_rate: int, norm: Optional[str] = None, mel_scale: str = 'htk') Tensor[源代码]

创建频率箱转换矩阵。

This feature supports the following devices: CPU This API supports the following properties: TorchScript

注意

为了与 librosa 的数值兼容性,并非所有结果滤波器组中的系数幅度都为 1。

Visualization of generated filter bank
参数:
  • n_freqs (int) – 要突出显示/应用的频率数量

  • f_min (float) – 最小频率 (Hz)

  • f_max (float) – 最大频率 (Hz)

  • n_mels (int) – 梅尔滤波器组的数量

  • sample_rate (int) – 音频波形的采样率

  • norm (strNone, 可选) – 如果为 “slaney”,则将三角形梅尔权重除以梅尔频带的宽度(面积归一化)。(默认值:None

  • mel_scale (str, 可选) – 要使用的比例:htkslaney。(默认值:htk

返回:

大小为 (n_freqs, n_mels) 的三角形滤波器组(fb 矩阵),表示要突出显示/应用于 x 的频率数量,即滤波器组的数量。每列是一个滤波器组,因此假设存在大小为 (…, n_freqs) 的矩阵 A,则应用的结果将是 A @ melscale_fbanks(A.size(-1), ...)

返回类型:

Tensor

使用 melscale_fbanks 的教程
Audio Feature Extractions

音频特征提取

音频特征提取

文档

访问 PyTorch 的综合开发者文档

查看文档

教程

获取面向初学者和高级开发者的深入教程

查看教程

资源

查找开发资源并获得您的问题解答

查看资源