torchaudio.functional.melscale_fbanks¶
- torchaudio.functional.melscale_fbanks(n_freqs: int, f_min: float, f_max: float, n_mels: int, sample_rate: int, norm: Optional[str] = None, mel_scale: str = 'htk') Tensor [source]¶
创建一个频率 bin 转换矩阵。
注意
为了与 librosa 在数值上兼容,生成的滤波器组中并非所有系数的大小都为 1。
- 参数::
- 返回值::
大小为 (
n_freqs
,n_mels
) 的三角形滤波器组(fb 矩阵),表示要突出显示/应用于 x 的频率数量和滤波器组的数量。每列都是一个滤波器组,因此假设有一个大小为 (…,n_freqs
) 的矩阵 A,则应用的结果将为A @ melscale_fbanks(A.size(-1), ...)
。- 返回类型::
张量
- 使用
melscale_fbanks
的教程 - 音频特征提取