快捷方式

SquimObjective

class torchaudio.models.SquimObjective(encoder: Module, dprnn: Module, branches: ModuleList)[source]

语音质量和可懂度度量 (SQUIM) 模型,用于预测语音增强(例如,STOI、PESQ 和 SI-SDR)的**客观**指标分数。

参数:
  • encoder (torch.nn.Module) – 编码器模块,用于将 1D 波形转换为 2D 特征表示。

  • dprnn (torch.nn.Module) – DPRNN 模块,用于对序列特征进行建模。

  • branches (torch.nn.ModuleList) – 变换器分支,每个分支估计一个客观指标分数。

使用 SquimObjective 的教程
Torchaudio-Squim: Non-intrusive Speech Assessment in TorchAudio

Torchaudio-Squim:Torchaudio 中的非侵入式语音评估

Torchaudio-Squim:Torchaudio 中的非侵入式语音评估

方法

forward

SquimObjective.forward(x: Tensor) List[Tensor][source]
参数:

x (torch.Tensor) – 输入波形。维度为 (batch, time) 的张量。

返回值:

分数张量的列表。每个张量的维度为 (batch,)

返回类型:

List(torch.Tensor)

工厂函数

squim_objective_model

构建自定义 torchaudio.prototype.models.SquimObjective 模型。

squim_objective_base

使用默认参数构建 torchaudio.prototype.models.SquimObjective 模型。

文档

获取 PyTorch 的全面开发者文档

查看文档

教程

获取针对初学者和高级开发人员的深入教程

查看教程

资源

查找开发资源并获得问题的解答

查看资源