快捷方式

torchaudio.functional.amplitude_to_DB

torchaudio.functional.amplitude_to_DB(x: Tensor, multiplier: float, amin: float, db_multiplier: float, top_db: Optional[float] = None) Tensor[source]

将频谱图从功率/幅度(amplitude)标度转换为分贝(decibel)标度。

This feature supports the following devices: CPU, CUDA This API supports the following properties: Autograd, TorchScript

批处理中每个张量的输出取决于该张量的最大值,因此对于分割成片段的音频剪辑与完整的剪辑,可能会返回不同的值。

参数:
  • x (Tensor) –

    转换为分贝标度之前的输入频谱图。预期的形状是 (freq, time), (channel, freq, time)(..., batch, channel, freq, time)

    注意

    当指定 top_db 时,将为批处理中的每个音频计算截止值。因此,如果输入形状是 4D(或更大),则批处理中的音频数据将使用不同的截止值。如果输入形状是 2D 或 3D,则使用单个截止值。

  • multiplier (float) – 功率(power)使用 10.,幅度(amplitude)使用 20.

  • amin (float) – 用于限制 x 的数字

  • db_multiplier (float) – Log10(max(参考值和 amin))

  • top_db (floatNone, 可选) – 最小负截止分贝值。一个合理的数字是 80. (默认: None)

返回:

分贝标度下的输出张量

返回类型:

Tensor

文档

访问 PyTorch 全面开发者文档

查看文档

教程

获取针对初学者和高级开发者的深入教程

查看教程

资源

查找开发资源并获取问题解答

查看资源