torchaudio.functional.amplitude_to_DB¶
- torchaudio.functional.amplitude_to_DB(x: Tensor, multiplier: float, amin: float, db_multiplier: float, top_db: Optional[float] = None) Tensor [source]¶
将频谱图从功率/幅度刻度转换为分贝刻度。
批次中每个张量的输出取决于该张量的最大值,因此对于分割成片段的音频剪辑与完整剪辑可能会返回不同的值。
- 参数:
x (Tensor) –
转换为分贝刻度之前的输入频谱图。期望的形状为
(freq, time)
、(channel, freq, time)
或(..., batch, channel, freq, time)
。注意
当指定
top_db
时,将为批次中的每个音频计算截止值。 因此,如果输入形状为 4D(或更大),则批次中的音频数据将使用不同的截止值。 如果输入形状为 2D 或 3D,则使用单个截止值。multiplier (float) – 功率使用 10.,幅度使用 20.
amin (float) – 用于钳制
x
的数值db_multiplier (float) – Log10(max(参考值和 amin))
top_db (float 或 None,可选) – 分贝为单位的最小负截止值。 合理的数字是 80。(默认值:
None
)
- 返回值:
分贝刻度的输出张量
- 返回类型:
Tensor