torchaudio.functional.spectral_centroid¶ torchaudio.functional.spectral_centroid(waveform: Tensor, sample_rate: int, pad: int, window: Tensor, n_fft: int, hop_length: int, win_length: int) → Tensor[源代码]¶ 计算沿时间轴每个通道的频谱质心。 频谱质心定义为频率值的加权平均值,权重为其幅度。 参数: waveform (Tensor) – 维度为 (…, time) 的音频张量 sample_rate (int) – 音频波形的采样率 pad (int) – 信号的双边填充 window (Tensor) – 应用/乘以每个帧/窗口的窗口张量 n_fft (int) – FFT 的大小 hop_length (int) – STFT 窗口之间的跳跃长度 win_length (int) – 窗口大小 返回: 维度 (…, time) 返回类型: Tensor