目录

快捷方式

torchaudio.functional.amplitude_to_DB¶

torchaudio.functional.amplitude_to_DB(x: Tensor, multiplier: float, amin: float, db_multiplier: float, top_db: Optional[float] = None) → Tensor[source]¶

将频谱图从功率/幅度（amplitude）标度转换为分贝（decibel）标度。

批处理中每个张量的输出取决于该张量的最大值，因此对于分割成片段的音频剪辑与完整的剪辑，可能会返回不同的值。

参数:

x (Tensor) –
转换为分贝标度之前的输入频谱图。预期的形状是 (freq, time), (channel, freq, time) 或 (..., batch, channel, freq, time)。

注意

当指定 top_db 时，将为批处理中的每个音频计算截止值。因此，如果输入形状是 4D（或更大），则批处理中的音频数据将使用不同的截止值。如果输入形状是 2D 或 3D，则使用单个截止值。
multiplier (float) – 功率（power）使用 10.，幅度（amplitude）使用 20.
amin (float) – 用于限制 x 的数字
db_multiplier (float) – Log10(max(参考值和 amin))
top_db (float 或 None, 可选) – 最小负截止分贝值。一个合理的数字是 80. (默认: None)

返回:

分贝标度下的输出张量

返回类型:

Tensor

文档

访问 PyTorch 全面开发者文档

查看文档

教程

获取针对初学者和高级开发者的深入教程

查看教程

资源

查找开发资源并获取问题解答

查看资源