MFCC¶
- class torchaudio.transforms.MFCC(sample_rate: int = 16000, n_mfcc: int = 40, dct_type: int = 2, norm: str = 'ortho', log_mels: bool = False, melkwargs: Optional[dict] = None)[源代码]¶
从音频信号创建梅尔频率倒谱系数。
默认情况下,这会在 DB 缩放的梅尔谱图上计算 MFCC。这并非教科书上的实现,但在此实现是为了与 librosa 保持一致性。
该输出取决于输入谱图中的最大值,因此对于分割成片段的音频剪辑与完整的音频剪辑,可能会返回不同的值。
- 参数:
- 示例
>>> waveform, sample_rate = torchaudio.load("test.wav", normalize=True) >>> transform = transforms.MFCC( >>> sample_rate=sample_rate, >>> n_mfcc=13, >>> melkwargs={"n_fft": 400, "hop_length": 160, "n_mels": 23, "center": False}, >>> ) >>> mfcc = transform(waveform)
另请参阅
torchaudio.functional.melscale_fbanks()
- 用于生成滤波器组的函数。- 使用
MFCC
的教程