MFCC¶
- class torchaudio.transforms.MFCC(sample_rate: int = 16000, n_mfcc: int = 40, dct_type: int = 2, norm: str = 'ortho', log_mels: bool = False, melkwargs: Optional[dict] = None)[source]¶
从音频信号创建梅尔频率倒谱系数。
默认情况下,这会计算 DB 缩放的梅尔谱图上的 MFCC。这不是教科书中的实现,但在此处实现是为了与 librosa 保持一致。
此输出取决于输入谱图中的最大值,因此对于分割成片段的音频片段与完整片段相比,可能会返回不同的值。
- 参数:
- 示例
>>> waveform, sample_rate = torchaudio.load("test.wav", normalize=True) >>> transform = transforms.MFCC( >>> sample_rate=sample_rate, >>> n_mfcc=13, >>> melkwargs={"n_fft": 400, "hop_length": 160, "n_mels": 23, "center": False}, >>> ) >>> mfcc = transform(waveform)
另请参阅
torchaudio.functional.melscale_fbanks()
- 用于生成滤波器组的函数。- 使用
MFCC
的教程 - 音频特征提取