torchaudio.functional.detect_pitch_frequency¶ torchaudio.functional.detect_pitch_frequency(waveform: Tensor, sample_rate: int, frame_time: float = 0.01, win_length: int = 30, freq_low: int = 85, freq_high: int = 3400) → Tensor[源代码]¶ 检测音调频率。 它是使用归一化互相关函数和中值平滑实现的。 参数: waveform (Tensor) – 尺寸为 (…, freq, time) 的音频张量 sample_rate (int) – 波形的采样率 (Hz) frame_time (float, 可选) – 帧的持续时间 (默认值:10 ** (-2))。 win_length (int, 可选) – 用于中值平滑的窗口长度(以帧数表示)(默认值:30)。 freq_low (int, 可选) – 可检测到的最低频率 (Hz)(默认值:85)。 freq_high (int, 可选) – 可检测到的最高频率 (Hz)(默认值:3400)。 返回值: 尺寸为 (…, frame) 的频率张量 返回类型: 张量 使用 detect_pitch_frequency 的教程 音频特征提取 音频特征提取