快捷方式

SquimObjective

class torchaudio.models.SquimObjective(encoder: Module, dprnn: Module, branches: ModuleList)[source]

语音质量和可懂度指标 (SQUIM) 模型,用于预测语音增强的客观指标分数(例如,STOI、PESQ 和 SI-SDR)。

参数:
  • encoder (torch.nn.Module) – 编码器模块,用于将 1D 波形转换为 2D 特征表示。

  • dprnn (torch.nn.Module) – DPRNN 模块,用于建模序列特征。

  • branches (torch.nn.ModuleList) – Transformer 分支,每个分支估计一个客观指标分数。

使用 SquimObjective 的教程
Torchaudio-Squim: Non-intrusive Speech Assessment in TorchAudio

Torchaudio-Squim:TorchAudio 中的非侵入式语音评估

Torchaudio-Squim:TorchAudio 中的非侵入式语音评估

方法

forward

SquimObjective.forward(x: Tensor) List[Tensor][source]
参数:

x (torch.Tensor) – 输入波形。维度为 (batch, time) 的张量。

返回:

分数张量列表。每个张量的维度为 (batch,)。

返回类型:

List(torch.Tensor)

工厂函数

squim_objective_model

构建自定义的 torchaudio.prototype.models.SquimObjective 模型。

squim_objective_base

使用默认参数构建 torchaudio.prototype.models.SquimObjective 模型。

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取面向初学者和高级开发者的深入教程

查看教程

资源

查找开发资源并获得问题解答

查看资源